Вести.net: у Mail.Ru Group теперь собственный поиск, а интернет-пользователи оцифруют Толстого

Вести.net: у Mail.Ru Group теперь собственный поиск, а интернет-пользователи оцифруют Толстого - фото 1Mail.Ru Group перешла на собственный поиск. Компания Дмитрия Гришина давно вела работу над собственным поисковым алгоритмом, однако, на протяжении последних 10 лет пользовалась как своими, так и покупными технологиями.

 

В разное время они лицензировались у "Яндекс" и Google. При этом, последняя обрабатывала порядка 60% глобальных поисковых запросов пользователей Mail.ru, а на долю собственного поискового движка компании приходилось около 40%, и это были запросы на русском языке.

1 июля в Mail.Ru Group объявили, что контракт с Google истекает в июле, и продлевать его не планируется. Теперь 100% поисковых запросов пользователей будет обрабатывать собственный поисковый движок Mail.Ru Group. По поводу качества поиска в Mail Ru Group ссылаются на данные компании "Ашманов и партнеры", которая анализирует выдачу по различным параметрам:

"Еще зимой по многим показателям было отмечено, что качество поиска достигло того уровня, когда оно удовлетворяет уже большему количеству запросов, претензий и пожеланий. То есть, качество вышло, наконец, на тот уровень, который позволяет запустить продукт без сторонней поддержки, запустить его самостоятельно", — говорит PR-директор Mail.Ru Group Ксения Чабаненко.

Сегодня поиск Mail.Ru – третья по величине поисковая система рунета после "Яндекса" и Google. Согласно данным Liveinternet, ее доля составляет 8,6%.

"Если говорить о том, что мы росли с нуля в той ситуации, которая у нас есть, а она у нас далеко не самая простая, то результаты удовлетворительные. В Казахстане отличные результаты — у нас там 23%, и это зашкаливает за все какие-то нормальные темпы роста поисковиков. Там поиск очень популярен, в связи с этим наш поиск работает и на языках, популярных в странах СНГ тоже", — говорит Ксения Чабаненко.

В то время как некоторые аналитики видят причину перехода российской корпорации на собственный поиск в коммерческих интересах — значительную долю от контекстной рекламы на Mail.Ru ранее получал Google — издание "Известия" связало отказ от чужого поиска с подготовкой компании Дмитрия Гришина к выходу на мировой рынок.

Так, в октябре 2012 года холдинг стал владельцем домена my.com, который планируется использовать в ходе вывода его продуктов за рубежом. Впрочем, в Mail.Ru Group эти слухи не комментируют:

"Я бы рассматривала, все-таки, этот запуск поиска как отдельную и важную историю, которая позволит предоставлять нам пользователям и более качественный продукт, и быть более гибкими самим. В то же время во многих наших продуктах, в первую очередь и в социальных сервисах, требуется хорошего качества и достойного уровня поиск. Сейчас, обладая собственным поиском и алгоритмами, нам гораздо легче, и мы гораздо эффективнее можем интегрировать его в наши продукты", — PR-директор Mail.Ru Group Ксения Чабаненко.

***

Интернет-пользователи оцифруют Толстого. Проект, запущенный Музеем Толстого совместно с компанией ABBYY, стартовал 18 июня. Конечная цель — создать общедоступную электронную версию 90-томного собрания сочинений классика, которую можно будет бесплатно загрузить в смарфтон планшет или букридер.

Хотя последний том вышел более полувека назад — в 1958 году, данное собрание сочинений в академических кругах считается самым полным. Помимо известных произведений собрание включает библиографические редкости — дневники и письма Толстого в 44 томах. Пока что тексты были доступны только в виде тяжелого архива, а качество изображений страниц при этом зачастую оставляет желать лучшего.

Как отметила праправнучка писателя Фекла Толстая, классик завещал безвозмездно распространять и перепечатывать свои произведения, поэтому появление его работы в открытом доступе в Интернете — это реализация последней воли Льва Толстого. 18 июня организаторы проекта обратились к интернет-сообществу с просьбой принять участие в вычитке многотомника.

Любой желающий может зарегистрироваться на сайте www.readingtolstoy.ru и получить доступ к отсканированным текстам из собрания сочинений — они разделены на пакеты по 20 страниц. После этого волонтеры могут приступить к вычитке текста при помощи специальной версии ABBYY FineReader, которая, впрочем, недоступна владельцам компьютеров Mac.

В Музее Толстого закладывали на оцифровку силами интернет-сообщества несколько месяцев, однако уже 28 июня — через 10 дней после старта проекта — организаторы объявили, что первый этап вычитки практически завершен. За это время более полутора тысяч участников вычитали свыше 40 000 страниц. В музее уже сообщили о переходе ко второму этапу оцифровки. Хотя изначально вторичную проверку собирались поручить профессиональным корректорам, столь успешный краудсорсинг заставил создателей проекта вновь призвать на помощь волонтеров. По всей видимости, первые труды из многотомника появятся в Сети не в сентябре, как планировали организаторы, а намного раньше.

Это не единственный пример краудсорсинга по расшифровке текстов. Самый известный образец с большой долей вероятности встречался каждому интернет-пользователю. Речь идет о CAPTCHA — тесте, который позволяет отличить человека от робота. В университете Карнеги — Меллон придумали собственную его модификацию — reCAPTCHA — когда пользователю предлагается расшифровать небольшой отрывок из какого-то текста.

 

http://hitech.vesti.ru/news/view/id/2314

Добавить комментарий


Защитный код
Обновить