До 2000 года человечество за всю свою историю создало приблизительно 1 млрд. значимых изображений. Сейчас благодаря распространению цифровой фотографии столько же изображений размещается в интернете пользователями каждую неделю. К концу прошлого года на серверах разных сайтов, социальных сетей и фотохостингов накопилось более 3 трлн. картинок. При этом только около 10 млрд. изображений (0,3% от общего количества) являются «видимыми» для поисковых систем, поскольку их можно проиндексировать по ключевым словам или текстовым мета-данным. Питерский стартап Kuznech.com, основанный при участии Павла Черкашина (в прошлом главы российского филиала Adobe и топ-менеджера Microsoft), — один из многих, пытающихся проиндексировать остальные 99,7% изображений, не снабженных текстовыми данными. По мнению Черкашина, это такой же вызов, как запуск космического корабля.
Сделать триллионы «безродных» изображений доступными для поиска — задача, на которую Павлу Черкашину и его команде не жалко потратить годы. «Если есть шанс эффективно решить хотя бы часть задачи, то игра стоит свеч», — убежден Черкашин, отвечающий за разработку бизнес-стратегии Kuznech.com. Его партнер Михаил Погребняк занимается созданием и технической реализацией продукта, а идеологом и разработчиком основных алгоритмов стал Александр Валенсия-Кампо, который занимается проблемой поиска изображений более семи лет.
«Задача поиска по изображениям чем-то сродни полету в далекий космос, — философствует Черкашин. — У людей слишком долго развиваются и растут ожидания от возможностей такой технологии. Как потребители ждут контактов с внеземными цивилизациями и надежной защиты Земли от астероидов, так же они ждут возможности навести камеру своего смартфона на лицо незнакомца на улице и получить из социальных сетей исчерпывающую информацию о нем. Или сфотографировать кофточку и тут же получить предложения аналогичного товара от интернет-магазинов. Любые задачи мельче этих автоматически вызывают разочарование: «Ерунда это тогда, а не визуальный поиск». Сегодня в мире несколько десятков команд ищут решение задачи поиска по изображениям, но еще никто из них не добился впечатляющих результатов. По мнению Черкашина, большинство компаний занимаются скорее не решением глобальной задачи, а попытками как можно раньше монетизировать свои технологии. Те, кому удается получить стабильный источник дохода, сворачивают исследования и перестают приближать светлое будущее визуального поиска. «Тех же, кто осмеливается забраться дальше в открытое пространство, косят крупные корпорации, — сетует Черкашин. — Amazon, Apple, Google, Microsoft за последние пять лет скупили сотни компаний, занимающихся визуальным поиском. Причем большинство таких приобретений делается «на всякий случай» — не для того, чтобы самим развивать технологию, а чтобы конкурентам не досталось». Тем не менее Черкашин уверен, что проблема решаема: «Необходимый математический аппарат был разработан еще в 1980-е, вычислительная мощность и хранилища данных дешевеют с невероятной скоростью, способных программистов очень много. Основная проблема заключается в комплексности и многомерности задачи. Качественный визуальный поиск нужен в медицине, геологии, сфере безопасности и военной промышленности, строительстве, электронной коммерции, в области защиты прав интеллектуальной собственности, потребительских социальных сервисах и т.д.».
Основатели Kuznech.com вполне осознавали уровень технических рисков на старте, а также неготовность инвесторов финансировать исследовательские проекты с неясными перспективами коммерциализации. Поэтому решили попытать счастья в Сколково. «Сложно было представить, что задача будет воспринята как недостаточно научная. Практического опыта реализации сложных технических проектов у основателей много, и подозревать их в пустых обещаниях никто не будет. Подготовка заявки на финансирование проекта и начальная разработка для проверки основных гипотез заняли около полугода. Все это время компания жила за счет собственных средств основателей, благо постоянного штата и отдельного офиса еще не было. После одобрения проекта со стороны Сколково привлечение частных инвестиций в размере $250 тыс., необходимых для выполнения наших обязательств, заняло ровно одни выходные — даже презентацию не успели доделать», — вспоминает Черкашин.
Еще $750 тыс. компания получила уже от фонда Сколково — причем это уже были не посевные инвестиции, а так называемые инвестиции серии А, которые обычно получают компании с проверенной бизнес-моделью и даже доходом. Назначение таких инвестиций — не только R&D, но и масштабирование бизнеса. Правда, признается Черкашин, компания пока не определилась с окончательным планом развития. «Нашу текущую стратегию можно описать известным рецептом итальянских кулинаров: бросайте все на стену, что прилипнет — то и спагетти. Этим мы и занимаемся. Как и со многими новыми технологиями, нельзя однозначно сказать, стоит ли развиваться по модели В2В или делать сервисы для конечных потребителей. В Google начинали как поставщики поисковой технологии для крупных компаний, и неизвестно, стали бы они столь успешными, если бы не вступили в партнерство с Yahoo. Другому поставщику технологии поиска — компании Endeca — так и не удалось запустить потребительский сервис, и в результате Endeca была поглощена компанией Oracle за $1 млрд.», — рассуждает Черкашин. «Лицензирование технологии компаниям в области электронной коммерции, порталам и крупным корпорациям — это стабильный источник дохода и возможность тренироваться на более узких прикладных задачах, прежде чем выходить на широкий круг потребителей, — продолжает Черкашин. — С другой стороны, на корпоративном лицензировании построить крупный бизнес очень сложно — по крайней мере, быстро этого не сделаешь. Основная добавленная стоимость сейчас формируется на потребительском рынке. Мы выпускаем прототипы, изучаем их применимость и востребованность и ищем тот главный сценарий, который позволит нам при существующем уровне технологии предложить потребителям действительно революционный сервис».
Какую же революцию готовит Kuznech.com? В основе технологии поиска на данный момент лежит метод статистического сравнения изображений. То есть система не пытается распознать объекты на изображениях, а анализирует около 300 стандартных параметров для каждой картинки и по каждому из них ищет похожие среди других изображений в собственном поисковом кэше. Система распознает цвета, основные формы, наличие человеческих лиц, характерных линий, контрольных точек и т.п. «По отдельности алгоритм сравнения изображений по каждому из этих параметров сделает любой студент-математик. Но объединить сотни параметров и заставить поиск работать за доли секунды по миллиардам изображений — это задача совершенно другого уровня сложности. В конечном итоге все упирается в деньги. Если обработка одного изображения обойдется в доллар, то анализ миллиарда изображений становится неподъемной задачей. Мы смогли снизить стоимость обработки и сравнения в сотни раз по сравнению с известными нам аналогами», — объясняет Черкашин. Сейчас в тестовой базе проекта хранится всего несколько миллионов изображений. В компании рассчитывают использовать технологию совместно с фотохостингами, фотобанками и социальными сетями — это позволит выйти на массовый рынок и сэкономить на продвижении. Сегодня для создания альфа-версии визуальной поисковой системы Kuznech.com требуются дополнительные инвестиции в размере $2,8 млн. Шансы найти необходимые средства довольно велики: за два года существования компания побеждала или занимала призовые места на нескольких конкурсах стартапов — начиная от ежегодной конференции инвесторов, которая проходит в Кремниевой долине, и заканчивая всероссийским конкурсом БИТ-2012. Так что у Kuznech.com уже есть определенная репутация в венчурных кругах.
Павел Черкашин
В 1995 году окончил географический факультет МГУ им. М.В. Ломоносова. В 1997 году основал компанию Actis Systems, в 2000-м — Sputnik Labs (в обеих занимал должности генерального директора). В 2004 году перешел на работу в компанию Siebel Systems, где стал главой российского представительства. Через два года занял должность главы представительства Adobe Systems в России и СНГ. В 2009 году перешел в Microsoft, где отвечал за потребительскую стратегию и онлайн-сервисы. В 2007 году стал инвестором стартапа Tvigle Media. В 2011 году инвестировал в проект Kuznech.com, в котором отвечает за развитие. Также является инвестором и соучредителем сервиса Krible.
Текст: Алексей Упатов