Когда официально была анонсирована поисковая машина yandex ru и где
Перейти к содержимому

Когда официально была анонсирована поисковая машина yandex ru и где

  • автор:

Поиск информации в Интернете/Яндекс

Яндекс — российская интернет-компания, владеющая порталом Yandex.Ru. Основная задача поискового сервиса Yandex.Ru — давать ответы на вопросы пользователей. Вопросы бывают явные и неявные. Явные вопросы пользователи задают в поисковой строке, а Yandex.Ru отвечает на них на страницах результатов поиска. На неявные вопросы, например, «какая сегодня погода», «происходит ли сейчас что-то важное», «можно ли проехать по городу» Yandex.Ru отвечает своими справочными сервисами. Яндекс — поисковая машина, способная по вашему запросу найти в русскоязычной части интернета наиболее подходящие веб-страницы, новости, картинки, статьи энциклопедий или товары, дать ответ на вопрос о погоде или культурных событиях.

История [ править ]

Официально поисковая машина Yandex.Ru была анонсирована 23 сентября 1997 года на выставке Softool. Основными отличительными чертами Yandex.Ru на тот момент были проверка уникальности документов (исключение копий в разных кодировках), а также ключевые свойства поискового ядра Яndex, а именно: учет морфологии русского языка (в том числе и поиск по точной словоформе), поиск с учетом расстояния (в том числе в пределах абзаца, точное словосочетание), и тщательно разработанный алгоритм оценки релевантности (соответствия ответа запросу), учитывающий не только количество слов запроса, найденных в тексте, но и «контрастность» слова (его относительную частоту для данного документа), расстояние между словами, и положение слова в документе.

Через два месяца, в ноябре 1997 года, был реализован естественно-языковый запрос, что позволяет задавать длинные запросы, например: «где купить компьютер», «генетически модифицированные продукты» или «коды международной телефонной связи» и получать точные ответы.

В 1998 году на Yandex.Ru появилась возможность «найти похожий документ», список найденных серверов, поиск в заданном диапазоне дат и сортировка результатов поиска по времени последнего изменения.

В 2005 году Яндекс создал «Новости в лицах» (сегодня «Яндекс.Пресс-портреты» [1] ), приобретя у [w:Интегрум|«Интегрума»] [2] право использования сервиса «Сегодня в лицах», выделяющего из любого количества источников фамилии и имена ньюсмейкеров и формирующего его в общие списки с привязкой каждой персоны к статьям.

  • Расширенный поиск
  • Семейный поиск
  • Настройка поиска
  • Язык запросов
  • Вирус подмены страниц
  • FAQ
  • Глоссарий
  • Поиск в Яндексе через браузеры
  • Поисковые подсказки

Поисковые сервисы [ править ]

Поисково-информационные [ править ]

  • Поиск По всему интернету PDA;
  • Каталог Сайты, отобранные вручную PDA;
  • Новости Картина дня, созданная автоматически PDA;
  • Поиск по блогам и форумам Что происходит в интернете прямо сейчас PDA;
  • Маркет Выбор моделей и поиск товаров PDA;
  • Авто Поиск по объявлениям о продаже автомобилей;
  • Словари Энциклопедии и справочники, иностранные языки PDA;
  • Видео Поиск роликов, видеохостинг;
  • Картинки Поиск изображений;
  • Карты С точностью до дома PDA;
  • Пробки Карта дорожного движения;
  • Расписания Поезда и самолеты;
  • Адреса Поиск контактов и организаций;
  • Афиша Чем заняться в свободное время PDA;
  • Книги Поиск книг, изданий и авторов;
  • Погода В России и за рубежом PDA;
  • Телепрограмма Центральные, спутниковые, региональные каналы PDA;
  • Время Разница во времени между городами.

Специальные виды поиска [ править ]

Контакты [ править ]

Офис в Москве (Парк Культуры) Адрес: Адрес: 119021, Москва, ул. Льва Толстого, 16 Секретарь: тел.: +7 495 739-70-00, факс: +7 495 739-70-70 Коммерческий отдел: тел.: +7 495 739-22-22, факс: +7 495 739-23-32, электронная почта: adv@yandex-team.ru Клиенты из регионов России могут звонить по бесплатному номеру 8 800 333-96-39 (или, для мнемонического запоминания, 8 800 333-YNDX) Отдел по связям с общественностью: pr@yandex-team.ru Помощь по проектам Яндекса и обращение к службе поддержки: help.yandex.ru

Примечания [ править ]

  1. ↑«Яндекс.Пресс-портреты»
  2. ↑http://company.yandex.ru/blog/?msg=100050&month=8

Яндекс: история создания, краткая справка о поисковой системе

Поисковая система Яндекс (Yandex)

«Я́ндекс» — российская транснациональная компания, владеющая одноимённой системой поиска в Сети, интернет-порталами и службами в нескольких странах. Наиболее заметное положение занимает на рынках России, Турции, Украины, Беларуи и Казахстана.

Поисковая система «Яндекс» является четвёртой среди поисковых систем мира по количеству обработанных поисковых запросов (свыше 6,3 млрд в месяц на начало 2014 года). По состоянию на 5 июля 2015 года, согласно рейтингу Alexa.com, сайт yandex.ru по популярности занимает 19-е место в мире и первое место в России.

Поисковая система Yandex.ru была официально анонсирована 23 сентября 1997 года, и первое время развивалась в рамках компании CompTek International. Как отдельная компания «Яндекс» образовалась в 2000 году. В мае 2011 года Яндекс провёл первичное размещение акций, заработав на этом больше, чем какая-либо из Интернет-компаний со времён IPO поисковика Google в 2004 году.

Приоритетным направлением компании является разработка поискового механизма, но за годы работы «Яндекс» стал мультипорталом. В 2013 году «Яндекс» предоставляет более 50 служб. Некоторые из них — Яндекс.Поиск, Яндекс.Карты, Яндекс.Маркет, Поиск по блогам, Яндекс.Пробки — доминируют на рынке.

Головной компанией холдинга является зарегистрированное в Нидерландах в 2004 году акционерное общество Yandex N.V., акции которого обращаются в основном на NASDAQ с более 50 % free float на 2014 год.

В России представлена «дочкой» ООО «Яндекс», главный офис которой находится в Москве на улице Льва Толстого, дом 16.

У компании также есть офисы в Санкт-Петербурге, Екатеринбурге, Новосибирске, Нижнем Новгороде, Одессе, Симферополе, Киеве, Казани, Ростове-на-Дону, Минске, Стамбуле, Берлине, Цюрихе, Люцерне и Шанхае. В середине июня 2008 года компания объявила об открытии Yandex Labs — офиса в США, штат Калифорния.

Яндекс История

В 1989 году предприниматель и программист Аркадий Волож основал фирму CompTek, продававшую персональные компьютеры и занимавшуюся автоматизацией рабочих мест. Также Волож интересовался алгоритмами обработки данных, и его заинтересовала возможность написания приложения, которое могло бы осуществлять поиск информации в больших объёмах текста, учитывая морфологию языка. Совместно со специалистом по компьютерной лингвистике Аркадием Борковским он основал в 1989 году компанию «Аркадия». После 1990 года сотрудники «Аркадии» написали информационно-поисковые системы «Международная классификация изобретений» и «Классификатор товаров и услуг». В последующие три года они продавались НИИ и патентным организациям.

Слово «Яndex» придумали Илья Сегалович, директор «Яндекса» по технологиям, и генеральный директор компании — Аркадий Волож. Илья выписывал разные производные от слов, описывающих суть технологии. В результате появился вариант «yandex» — Yet ANother inDEXer («ещё один индексатор»).

В 1993 году «Аркадию» присоединили к CompTek, в которую ранее пришёл школьный друг Воложа программист Илья Сегалович. В том же году была создана программа для поиска на жёстком диске компьютера. Программу назвали «Yandex». Сотрудничая с Институтом проблем передачи информации, CompTek создала словарь с поиском, который учитывал морфологию русского языка. В 1994 году был создан «Библейский компьютерный справочник».

В 1995 году было принято решение об использовании поискового приложения для сети Интернет. Сначала оно работало с ограниченным числом ресурсов, а позже со всем русскоязычным сегментом Интернета.

Официально поисковая машина Yandex.Ru была анонсирована 23 сентября 1997 года на выставке Softool. «Яндекс» не был первой поисковой машиной в России: в 1996 году появился «Рамблер», а ещё раньше, в декабре 1995-го, — Altavista, причём последняя имела самый производительный на тот момент сервер и отличалась самой высокой скоростью работы среди конкурентов, обрабатывая миллионы запросов в день. Через два месяца после yandex.ru анонсировали поисковую систему «Апорт» (хотя впервые её продемонстрировали ещё в феврале 1996 года).

К середине 1999 года «Яндекс» был в семёрке популярнейших сайтов рунета; выручка «Яндекса» как отдела CompTek’а в этом году составляла 72 тыс. долл.

В апреле 2000 года фонд ru-Net Holdings приобрёл 35,72 % акций «Яндекса» за $5,28 млн. В число акционеров вошли также менеджеры и ведущие разработчики поисковой системы. Генеральным директором стал Аркадий Волож. Компания «Яндекс» вышла из состава CompTek и стала независимой. Материнский холдинг располагался на Кипре, в России же зарегистрирована дочка в форме общества с ограниченной ответственностью.

В этом же году «Яндекс» первым из российских интернет-бизнесов запустил рекламную кампанию на телевидении, слоган которой, «Найдётся всё!» — стал крылатым выражением и навсегда закрепился на логотипе компании.

В 2001 году объявлен запуск новой версии поисковой машины: улучшился поиск ссылок, стала производиться морфологическая коррекция запроса, введён «взвешенный индекс цитирования» и повысилась точность и скорость поиска. В этом же году «Яндекс» обогнал «Рамблер» и с тех пор держит первое место в российском сегменте Интернета.

В том же 2001 году появляется система контекстной рекламы «Яндекс.Директ». Система быстро стала основным источником прибыли в компании: в 2002 году «Яндекс» выходит на самоокупаемость, а в 2003 году выплачивает акционерам дивиденды, общая сумма которых составила $100 тыс..

В 2005 году бизнес компании впервые выходит за пределы России — открывается представительство на Украине. Одновременно с открытием филиала в Одессе появляется портал www.yandex.ua. Впоследствии, в 2006 году в Санкт-Петербурге и в 2007 году в Екатеринбурге и Киеве появились офисы разработки, а в 2009 году в Екатеринбурге и в 2010 году в Новосибирске — офисы продаж. Кроме того, в 2008 году в Калифорнии была зарегистрирована дочерняя компания «Яндекса» — Yandex Laboratories (Yandex Labs). В 2008 году была запущена казахстанская версия портала «Яндекса», а в 2010 году — белорусская. В том же году компания открыла офис в Казани; главная страница портала, некоторые службы и поиск стали доступны как на русском, так и на татарском языке. Таким образом, возможности поиска в процессе работы с региональными ресурсами постепенно расширились.

В 2007 году происходит реструктуризация Яндекса и материнской компанией становится нидерландская Yandex N.V.

В том же году состоялось первое крупное поглощение «Яндекса» — была куплена социальная сеть профессионалов «Мой Круг» примерно за $1,5 млн. Крупное приобретение имело целью сделать более социальными прочие службы «Яндекса»; сразу после покупки сайт был перенесён на собственные дата-центры компании.

В 2010 году «Яндекс» открывает www.yandex.com — сайт для поиска по зарубежному сегменту Интернета, который также является тестовой площадкой для обкатки новых дизайнерских и инженерных решений. Одновременно на обычной версии сайта появилась кнопка «в мировом интернете», которая появляется над результатами поиска в случае иноязычного запроса. Нужно отметить, что индексировать и добавлять в поисковую выдачу сайты на других языках «Яндекс» начал ещё в 2008 году. Обслуживанием англоязычного поиска занимается калифорнийское отделение Yandex Labs.

24 мая 2011 года состоялся выход «Яндекса» на высокотехнологичную биржу NASDAQ. В ходе первичного размещения акций «Яндекс» привлёк $1,3 млрд (второй результат за всю историю наблюдений, после Гугла с его $1,67 млрд). В целом компанию оценили в $8 млрд, что в 500 раз превышает её первоначальную стоимость в 2000 году. Размещение акций планировалось ещё в 2008 году, но было отложено из-за всемирного кризиса. Десятки сотрудников компании стали миллионерами. 3 июня 2014 года акции компании прошли листинг и на Московской бирже.

20 сентября 2011 года «Яндекс» открывает портал в Турции. Поисковая система локализована для турецкоязычного пользователя, учитывает морфологию, понимает синонимы и исправляет опечатки. Полностью локализованы службы Почта, Новости, Перевод, Карты (в том числе Пробки и Панорамы) и другие, есть и уникальные службы. Это первый опыт «Яндекса» в не говорящей на русском стране; для завоевания нового рынка была открыта штаб-квартира с 50 сотрудниками.

В 2012 году выходит Яндекс.Браузер. Вскоре программа получает турецкую и украинскую локализации. С версии 1.1 начинается его рекламная кампания на ТВ.

В мае 2012 года в Государственной Думе Российской Федерации появился законопроект, в котором «Яндекс» и «ВКонтакте» признаются стратегическими предприятиями как общенациональные трансляторы информации. Ещё в 2009 году Президент России Дмитрий Медведев инициировал покупку «Сбербанком» «золотой акции» «Яндекса» с целью избежать попадания предприятия общегосударственной важности в руки иностранцев.

В том же 2012 году «Яндекс» обогнал «Первый канал» по численности ежедневной аудитории, что сделало российский интернет-гигант лидером отечественного медиарынка. В 2013 году Яндекс подтвердил этот статус, обогнав «Первый канал» по выручке.

В феврале 2013 года «Яндекс» оказался впереди «Майкрософта» по числу поисковых запросов, заняв таким образом четвёртое место в рейтинге мировых поисковых систем (после Google, Baidu и Yahoo!). Рост произошёл за счёт российского рынка. В целом «Яндекс» является самым быстрорастущим поисковиком из первой десятки.

В июле 2013 года глава «Яндекса» Аркадий Волож объявил о планах своей компании выйти за пределы Интернета и открытии в будущем служб в других отраслях.

1 сентября 2014 года Аркадий Волож ушёл с поста генерального директора российского сегмента «Яндекса», новым генеральным директором с 1 сентября стал Александр Шульгин. При этом А. Волож остаётся на посту генерального директора всей компании.

Средства "Яндекс" как инструменты маркетинга

В сентябре 1997 года была официально анонсирована поисковая машина Yandex.Ru, которая, благодаря внедрению технологии естественно-языкового запроса, открыла принципиально новые возможности для пользователей русскоязычного Интернета при осуществлении поиска в Сети.

В своем нынешнем виде компания «Яндекс» была создана в апреле 2000 года, после того как стратегическим инвестором «Яндекс» стала компания ru-Net Holdings. Генеральным директором новой компании стал Аркадий Волож, до этого возглавлявший CompTek.

Сегодня «Яндекс» предоставляет целый ряд сервисов для всех пользователей Интернета.

В конце мая «Яндекс» запустил новую версию поисковой машины. Была существенно повышена точность и интеллектуальность поиска, применены новые меры борьбы с поисковым спамом. Сегодня Yandex.Ru является самой мощной поисковой системой русского Интернета — поисковая база Yandex.Ru вдвое больше, чем у ближайших конкурентов.

В июле прошел совет директоров «Яндекса», который определил дальнейшие планы развития компании. Летом 2001 года «Яндекс» стал порталом номер один в России по данным исследовательских компаний Комкон-2 и Gallup Media.

Как возможности поисковой системы «Яндекс» помогают в проведении маркетинговых исследований?

А. Амилющенко, главный аналитик отдела маркетинга:

Интернет может помочь в проведении маркетинговых исследований. Его возможности позволяют изучить рынок, конкурентов, товары, цены, правильно организовать рекламную кампанию. Методы проведения исследований в Интернет-среде при этом практически не отличаются от традиционных. Другое дело, что технически они более прогрессивны, более развиты.

Рис 1. НИНИ-индекс

Рассмотрим, как возможности «Яндекс» помогают собирать и анализировать информацию, для чего прежде всего посмотрим, что именно люди ищут в «Яндексе».

Статистика: сейчас «Яндекс» в сутки посещают более 250 тыс. разных людей, что составляет около 1,5 млн. посетителей в неделю. Они каждый день задают «Яндексу» более полутора миллионов вопросов, в которых используется более 22 млн. слов в неделю.

Любой товар на рынке, любая торговая марка, название которой звучало на рынке, любое наименование с очень высокой степенью вероятности кто-то искал. Соответственно, можно понять, зачем, когда и почему это делалось.

Посмотрев статистику за неделю, видим, что, например, слово «Москва» искали в этот период более 94 тыс. раз (данные за первую неделю декабря 2001 г.). Видно, далее, что спрос на Шаляпина меньше, чем спрос на автомобили. Имея же статистику (статистика запросов хранится с начала истории «Яндекса»), ее можно обрабатывать. Еженедельно мы строим НИНИ-индекс, т.е. индекс непостоянства интересов населения Интернета (см. рис. 1). НИНИ-индекс устроен следующим образом: отбираем пять слов, доля которых наиболее сильно выросла в запросах, и пять слов, «спрос» на которые больше всего упал. Этот индекс отражает смену интересов, показывает, что людей сейчас стало больше интересовать, а что меньше. Очевидно, что на этот спрос влияют события, произошедшие в «обычной жизни» (необязательно в интернете) (см. рис. 2). Так, видно, например, что в конце марта пользователей заметно интересовала ситуация с затоплением орбитальной станции «Мир», а в сентябре — теракты в Америке. Очень большую смену интересов дает Новый год и другие праздники. Люди забывают про работу/учебу и ищут подарки, места, где можно отдохнуть и т.п. График НИНИ ведется с середины 1998 года. Можно оставить нам свой e-mail и каждую неделю получать обновления индекса по почте.

Рис 2. НИНИ за год

Десять слов, которые попадают в НИНИ-индекс, мы выбираем сами, но отследить «динамику изменения спроса» можно для любого, произвольно взятого слова или набора слов.

Например, слово «шина». Смотрим статистику с сентября прошлого года по сентябрь нынешнего года. Явно прослеживается тенденция: спрос на зимнюю резину, спрос на летнюю резину. Отчетливо видно падение продукцию на Новый год, 1 мая (см. рис. 3). Одновременно наблюдается рост пользователей Интернета почти в 2,5 раза. В прошлом году это слово спрашивали 700 раз в неделю, а в этом году — 2000. Увеличивается аудитория — растет спрос. Безусловно, это помогает тем, кто торгует шинами.

Рис. 3. «Шины» — спрос за год

А вот пример с «трикотажем». Когда мы показывали статистику по этой теме, то неспециалисту она ничего не говорила. Специалисты же из текстильной промышленности четко смогли объяснить полученные данные и их графическое представление. Например, осенью была выставка текстильной промышленности — всплеск интереса, видны и сезонные колебания, летом спрос снова вырос. И специалисты дали этим изменениям четкое объяснение (см. рис. 4).

Рис. 4. "Трикотаж" — спрос за год

Пример с информацией, касающейся сотовых операторов (рис. 5). Колебания спроса здесь в основном связаны с их рекламными мероприятиями — например, МТС (рис. 6). Доля запросов по этой компании — около 5 тыс. в неделю. «Би-Лайн» — менее популярный оператор в Интернете (рис. 7). Соответственно, запросов здесь поменьше (около 3 тыс.), тенденции же, тем не менее, одинаковы. «Московская сотовая связь» (МСС) — 300—400 запросов. Но на графике видно, что компанией были проведены какие-то акции, и спрос поднялся. Можно, таким образом, довольно четко отследить эффективность рекламной кампании.

Рис. 5. «Сотовый» — спрос за год

Рис. 6. «МТС» — спрос за год

Рис. 7. «Билайн» — спрос за год

Далее, мы можем делать и контент-анализ. Наши постоянные пользователи знают, что задавать одно слово в запросе не имеет смысла: Если вы напишите слово «компьютер», то непонятно, что вам нужно: купить компьютер, продать его, отремонтировать. Поэтому обычно пользователь пишет что-то вроде: «Где купить компьютер в Москве?». В среднем запрос состоит из 2,5—2,7 слова. То есть по каждому слову можно посмотреть, в каком контексте его искали. И это помогает лучше нацелить рекламу.

Вот практический пример. Работали мы с производителями строительных материалов. Товары были следующих наименований: кафель, шифер и т.д. Стали смотреть статистику по слову «шифер». Оказалось, что ищут в основном не строительный шифер, а фотомодель Клаудию Шиффер (то есть запрос «клаудиа шифер»). Следовательно, показывать рекламу строительного шифера, когда в запросе пользователя встречается слово «шифер», не имеет смысла. Это будут впустую выброшенные деньги. А надо сформулировать контексты как «шифер продажа», «куплю шифер», «шифер кровля» и т.д.

Что дает в целом такая статистика? И понимание рынка, и понимание своего места на рынке, возможность минимизации затрат при размещении таргетированной рекламы.

Еще одна возможность, которая у нас есть, — это пресс-клиппинг. Любая большая фирма, которая давно присутствует на рынке, интересуется, что про нее и про ее конкурентов пишут в прессе. Аналог этой услуги предоставляет и «Яндекс». Есть подписка на запросы — вы оставляете на «Яндексе» свой e-mail адрес и название вашей фирмы, вашего товара, вашего конкурента, а «Яндекс» присылает на ваш электронный адрес ссылки на новые появившиеся страницы в Интернете, соответствующие вашему запросу. Таким образом, вы сможете постоянно быть в курсе всего нового.

Аналогично проводится подписка на новости СМИ. Мы сотрудничаем сейчас более чем с 40 новостными агентствами, которые присылают нам ленту новостей. И если про вас упомянуто в ленте новостей, то вы можете, подписавшись на эти запросы, получать по e-mail список соответствующих новостей. Причем совершенно бесплатно.

Чем «Яндекс» может быть полезен при проведении мероприятий по продвижению товаров и услуг?

А. Амилющенко: Интернет может использоваться для решения различных задач по продвижению, в частности:

    1. Поддержка off-line мероприятий.
    2. Продвижение своей марки.
    3. Создание сообщества единомышленников, лояльных к вашей марке.
    4. Стимулирование продаж.

    Ярким примером использования возможностей «Яндекса» является проект «Яндекс.Пиво». «Яндекс.Пиво» — сообщество любителей пива. Здесь «всем миром» создается экспертная система по пиву (пивной Гуру). Здесь проходят конкурсы, здесь люди общаются в форуме.

    Теперь о том, что это такое с точки зрения решения задачи по продвижению пивной марки. «Яндекс.Пиво» имеет партнерские отношения с компанией Sun Interbriew о продвижении торговой марки «Клинское». Здесь не только «Клинское» рекламируется непосредственно на свою целевую аудиторию — любителей и ценителей пива, но дается еще и дополнительная информация — где можно выпить «Клинское», как оно производится, история марки, предлагаются конкурсы, анекдоты, фирменные обои. То есть людям предлагается не просто вспомнить о том, что существует «Клинское», но и дается повод и возможность проявить к нему повышенный интерес, стать более приверженным марке пива. По статистике, за сентябрь проект «Яндекс.Пиво» посетили более 100 тыс. «уникальных» человек, из них более 10% принимали активное участие в конкурсах, которые проводятся в рамках этого проекта. «Яндекс.Пиво» — это пример нестандартного решения маркетинговых задач.

    Еще один пример: совсем недавно на «Яндексе» закончилась кампания фирмы «Магги» — «Горячая кружка Магги». Был придуман следующий маркетинговый ход. Рекламное сообщение состояло в том, что во время перерыва неплохо бы перекусить «горячей кружкой Магги». Реклама показывалась только в обеденное время, с 12 до 16 часов. Демонстрировался небольшой тизер-баннер, на котором была изображена «горячая» рабочая ситуация: телефон не отвечает, стол завален бумагами и т.п. Пора обедать! Когда наводишь мышь на баннер, возникает картинка, в которой можно стереть верхний слой и увидеть очень красивую кружку Магги, после чего при желании можно перейти на сайт Магги.

    Для каждого крупного клиента приходится придумывать свои ходы. Не существует универсальных решений.

    Какие возможности «Яндекс» предоставляет для общения с клиентом?

    А. Амилющенко: Интернет предоставляет два способа для общения с клиентом:

    • массовое широковещание (показываем баннер на первой странице «Яндекса», и 250 тыс. человек в день его видят);
    • предельно точное таргетирование — выделение целевой аудитории.

    Задача таргетирования решается как контекстной рекламой, так и с помощью анкетирования. Можно предложить пользователю заполнить анкету и таким образом собрать базу конкретных адресов, а затем использовать эти данные для прямой адресной рассылки (естественно, предупредив заранее пользователя о такой возможности). Затраты на сбор такой информации значительно ниже, чем традиционным «офлайновым» способом.

    Что вы можете рассказать о PR посредством «Яндекса»?

    А. Амилющенко: Средства Интернета позволяют проводить PR-акции в on-line режиме.

    У нас на форуме, например, был представитель SwissAir. Его приход был заранее анонсирован на «Яндексе», люди могли оставить в форуме свои вопросы. Он разговаривал с людьми в режиме on-line, с теми, кого интересовала его компания. Вот пример, как компания может провести акцию по связям с общественностью.

    В подобных акциях принимают участие и представители политических кругов, и руководители крупных предприятий и фирм, и известные артисты, музыканты и певцы. «Живое» общение позволяет не только поделиться интересной информацией, но и получить непосредственную реакцию заинтересованных людей.

    Итак, очевидно «Яндекс» обладает огромным потенциалом как для проведения маркетинговых исследований, так и для мероприятий по продвижению фирмы и товаров на рынок.

    Поисковая система Яндекс

    Понятие и функции поисковой системы, ее цели и значение, закономерности работы. Основные характеристики данной информационной системы. Оценка возможностей Яндекса, история его становления и развития, особенности и сферы применения на современном этапе.

    Рубрика Программирование, компьютеры и кибернетика
    Вид реферат
    Язык русский
    Дата добавления 08.12.2013
    Размер файла 212,8 K
    • посмотреть текст работы
    • скачать работу можно здесь
    • полная информация о работе
    • весь список подобных работ

    Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

    Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

    Размещено на http://www.allbest.ru/

    Размещено на http://www.allbest.ru/

    Если брать в расчет русский интернет, то здесь Яндекс является безусловным лидером. В России это первая по значимости поисковая система. В настоящее время Яндекс — это не только поисковая система, это еще и многочисленные сервисы, к которым могут получить доступ абсолютно все пользователи этой поисковой машины. Здесь можно найти и нужную информацию, и сориентироваться по выбору досуга, находить картинки, товары, сравнивать цены, смотреть погоду, общаться в социальной сети, смотреть расписание телепередач, транспорта. На Яndex реализована удобная система Яндекс. Вебмастер, где реализован функционал для работы со своими сайтами. В числе последних доступных нововведений сервиса — Вебвизор, который достаточно долго оставался платным, но в декабре 2011 года этот сервис стал доступен абсолютно всем.

    Про замечательные технологии и полезные сервисы компании Яндекс можно продолжать еще очень и очень долго. Яndex — означает «Языковой index». Если переводить с английского, то получается «Yet Another indexer». Правда, потом, по мере развития поисковой машины, стали появляться и другие толкования. К примеру, если в английском Index перевести с английского на русский первую букву (I — Я), то получится «Яndex».

    Официально поисковая машина Yandex. Ru была анонсирована 23 сентября 1997 года на выставке Softool. Основными отличительными чертами Yandex. Ru на тот момент были проверка уникальности документов (исключение копий в разных кодировках), а также ключевые свойства поискового ядра Яndex, а именно: учет морфологии русского языка (в том числе и поиск по точной словоформе), поиск с учетом расстояния (в том числе в пределах абзаца, точное словосочетание), и тщательно разработанный алгоритм оценки релевантности (соответствия ответа запросу), учитывающий не только количество слов запроса, найденных в тексте, но и «контрастность» слова (его относительную частоту для данного документа), расстояние между словами, и положение слова в документе.

    1. История развития Информационно-поисковой системы Яндекс

    Компания «Яндекс» была создана — Аркадием Воложем и Аркадием Борковским. Она выросла из компании CompTek, которую возглавлял Волож в середине 90_х. Именно CompTek и разработал для Рунета собственную поисковую систему «Яндекс». Отправной точкой развития «поисковика» можно считать 2000 год, когда Волож году покинул CompTek и выделил «Яндекс» в отдельную компанию.

    Яндекс — это крупнейший российский портал, предлагающий пользователям ключевые интернет-сервисы. Ежедневная аудитория Яндекса составляет более 7 миллионов человек.

    Среди служб Яндекса — поиск в Интернете и каталог сайтов, новости и платежная система, карты и энциклопедии, электронная почта и система фильтрации спама, каталог товарных предложений, социальная сеть профессионалов и бесплатный фотохостинг, а также многое другое.

    Яндекс уделяет большое внимание работе с регионами. Все службы портала учитывают географическое положение пользователя: поиск позволяет задавать запрос только по региональным сайтам, Новости показывают местную информацию, Маркет в первую очередь предлагает товары из региональных магазинов. Региональная программа (проект Города) помогает привлекать к сотрудничеству интернет-компании и рекламные агентства со всех концов страны. Специалисты Яндекса проводят выездные семинары. А регулярно публикуемые интернет-индексы городов стали своеобразным индикатором развития интернета в России.

    Яндекс заинтересован в увеличении интенсивности использования интернета. В 2007 году открыта программа «Локальная сеть». Во всех федеральных округах России размещается сетевое оборудование компании и арендуются выделенные каналы. Таким образом, Яндекс становится локальным ресурсом для большинства российских пользователей. Более 300 кафе, ресторанов и других общедоступных заведений принимают участие в проекте Яндекс. WiFi. Ежегодные Открытые Кубки России по поиску в интернете, изобретенные Яндексом, помогают пользователям оценить интернет как уникальную справочную.

    Яндекс представляет собой рекламную площадку с возможностями как широкого охвата аудитории, так и точно сфокусированной рекламы. Система Яндекс. Директ первой в России позволила размещать рекламные объявлен ия в результатах поиска. По итогам 2006 года число рекламодателей Директа превысило 30 тысяч и продолжает расти. В 2005 году открыта Рекламная сеть Яндекса. Сегодня участниками Рекламной сети является большинство поисковых площадок и значительное количество крупных сайтов российского, украинского и белорусского интернета.

    Компания «Яндекс» вышла на самоокупаемость в ноябре 2002 года. Летом 2003 года Совет директоров компании принял решение о выплате дивидендов, первых в русском интернете. Летом 2006 года недельный оборот системы размещения контекстной рекламы Яндекс. Директ превысил 1 млн долларов. Оборот за 2009 год — 278 миллионов долларов. Оборот за 2008 год — более 300 млн. долларов. Оборот за 2006 год — 72,6 млн. долларов, чистая прибыль — 29,9 млн., за 2005 год — 35,6 млн. долларов, чистая прибыль — 13,6 млн. Вся бухгалтерская отчетность Яндекса с 2000 года аудируется компанией Deloitte&Touche.

    Главный офис компании расположен в Москве. В 2005 году открыто украинское представительство Яндекса в Одессе, в 2006 — офис в Санкт-Петербурге, а в 2007 — в Екатеринбурге и Киеве. Каждый год число сотрудников Яндекса удваивается, и сейчас в компании работают уже более тысячи сотрудников. Яндекс постоянно ищет новых специалистов в самых разных областях. Действует программа стажировок для студентов, проводятся лекции и семинары. В 2007 году Яндекс организовал Школу анализа данных, занятия в которой бесплатны.

    Сейчас Яндекс — это крупнейший российский портал, предлагающий пользователям ключевые интернет-сервисы. По данным исследовательских компаний Gallup Media, ФОМ и Комкон, он является самым большим ресурсом в Рунете по объему аудитории. Ежедневная аудитория Яндекса составляет более 5 млн человек. Среди служб Яндекса — поиск в интернете и каталог сайтов, новости и платежная система, карты и энциклопедии, электронная почта и система фильтрации спама, каталог товарных предложений, социальная сеть профессионалов и бесплатный фотохостинг, а также многое другое.

    Официально поисковая машина Yandex. Ru была анонсирована 23 сентября 1997 года на выставке Softool. Основными отличительными чертами Yandex. Ru на тот момент были проверка уникальности документов (исключение копий в разных кодировках), а также ключевые свойства поискового ядра Яndex, а именно: учет морфологии русского языка (в том числе и поиск по точной словоформе), поиск с учетом расстояния (в том числе в пределах абзаца, точное словосочетание), и тщательно разработанный алгоритм оценки релевантности (соответствия ответа запросу), учитывающий не только количество слов запроса, найденных в тексте, но и «контрастность» слова (его относительную частоту для данного документа), расстояние между словами, и положение слова в документе.

    Чуть позже в разделе «Сказки» (наблюдения за содержанием русского Интернета) появилась первая сказка Рунета — «Web — гуманизм или чернуха?». А в разделе «Числа» — первая оценка объема Рунета, 5 тысяч серверов и 4 ГБ текстов.

    Через два месяца, в ноябре 1997 года, был реализован естественно-языковый запрос. Отныне к Yandex. Ru можно обращаться просто «по-русски», задавать длинные запросы, например: «где купить компьютер», «генетически модифицированные продукты» или «коды международной телефонной связи» и получать точные ответы. Средняя длина запроса в Yandex. Ru сейчас — 2,7 слова. В 1997 году она составляла 1,2 слова, тогда пользователи поисковых машин были приучены к телеграфному стилю.

    В 1998 году на Yandex. Ru появилась возможность «найти похожий документ», список найденных серверов, поиск в заданном диапазоне дат и сортировка результатов поиска по времени последнего изменения. За этот год «объем» Русского Интернета удвоился, что привело к необходимости оптимизации поисковых механизмов. И тогда, и сейчас (при объеме в 200 ГБ) скорость поиска на Yandex. Ru — доли секунды.

    За 1999 год Рунет вырос на порядок, как в объемах текстов, так и в количестве пользователей. Это был год бурного развития и для Yandex. Ru. Новый поисковый робот позволил оптимизировать и ускорить обход сайтов Рунета. Сегодня поисковая база Yandex. Ru вдвое больше, чем у ближайших конкурентов.

    Новый робот позволил предоставить пользователям новые возможности — поиск по разным зонам текста (заголовкам, ссылкам, аннотациям, адресам, подписям к картинкам), ограничение поиска на группу сайтов, поиск по ссылкам и изображениям, а также выделять документы на русском языке. Появился поиск в категориях каталога и впервые в Рунете было введено понятие «индекс цитирования» — количество ресурсов, ссылающихся на данный.

    В течение всего года продолжалась работа по количественному и качественному анализу Рунета. Был открыт НИНИ-индекс (индекс «Непостоянства Интересов Населения Интернет»), показывающий динамику изменения интересов пользователей Интернета. Открылся поисковый Форум и новый сервис — подписка на запрос, то есть можно оставить свой запрос на Yandex. Ru и регулярно получать по электронной почте информацию о появлении новых и / или измененных документов, соответствующих этому запросу. К началу учебного года был открыт «Семейный Яndex», фильтрация результатов поиска от мата и порнографии.

    Яндекс разрабатывает не только полезные веб-сервисы, но и различные программы: как бесплатные приложения для массового пользователя, так и коммерческие серверные решения.

    Приложение для поиска по веб-сайту или локальной сети с учетом морфологии русского языка. Основная версия программы распространяется бесплатно.

    Это специальная программа, которую можно установить на компьютере и осуществлять с ее помощью полнотекстовый поиск с учётом морфологии русского языка по файлам разных форматов.

    Расширение, которое встраивается в браузер в виде дополнительной панели инструментов. У Яндекс. Бара есть много возможностей — от удобного и быстрого поиска до сохранения ваших закладок на серверах Яндекса и уведомлений о свежих сообщениях в Почте и Ленте.

    Это серверное решение для фильтрации спама, предназначенное для корпоративных пользователей и интернет-провайдеров. Продукт основан на технологии, уже несколько лет применяемой для защиты пользователей Яндекс. Почты. Система выполняет комплексный анализ тысяч характеристик письма с учетом их значимости, обеспечивая высокую полноту и точность фильтрации.

    2002 год ознаменовался тем, что компания «Яндекс» вышла на самоокупаемость.

    2009 стал для отечественного поисковика революционным — Яндекс запустил Матрикснет. Этот самообучающийся алгоритм на порядок улучшил качество поиска за счет учета множества факторов и комбинаций. Матрикснет затруднил продвижение сайтов в Яндекс и преобразил отечественный SEO_рынок, заставляя оптимизаторов искать новые методы продвижения веб-ресурсов. Помощник Матрикснета — алгоритм «Спектр» формирует выдачу, исходя из потребностей пользователя, и добавляет туда близкие запросу страницы.

    В мае 2011 года Яндекс вышел на IPO. Первичное размещение акций компании произошло на бирже Nasdaq. Желающие могут приобрести частичку поисковой машины, если купят акции под тикером YNDX.

    яндекс поисковый информационный

    2. Понятие и функции поисковой системы

    Поисковая система — это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу. Рассмотрим подробнее понятие поискового запроса на примере поисковой системы «Яндекс». Поисковый запрос должен быть сформулирован пользователем в соответствии с тем, что он хочет найти, максимально кратко и просто. Допустим, мы хотим найти информацию в «Яндексе» о том, как выбрать автомобиль. Для этого, открываем главную страницу «Яндекса», и вводим текст поискового запроса «как выбрать автомобиль». Далее, наша задача сводится к тому, чтобы открыть предоставленные по нашему запросу ссылки на источники информации в Интернет. Однако, вполне можно и не найти нужную нам информацию. Если таковое произошло, то либо нужно перефразировать свой запрос, либо в базе поисковой системе действительно нет никакой актуальной информации по нашему запросу (такое может быть при задании очень «узких» запросов, как, например «как выбрать автомобиль в Бирске»).

    Первоочередная задача любой поисковой системы — доставлять людям именно ту информацию, которую они ищут. А научить пользователей делать «правильные» запросы к системе, т.е. запросы, соответствующие принципам работы поисковых систем, невозможно. Поэтому разработчики создают такие алгоритмы и принципы работы поисковых систем, которые бы позволяли находить пользователям искомую ими информацию.

    Это означает, поисковая система должна «думать» так же, как думает пользователь при поиске информации. Когда пользователь обращается с запросом к поисковой машине, он хочет найти то, что ему нужно, максимально быстро и просто. Получая результат, он оценивает работу системы, руководствуясь несколькими основными параметрами. Нашел ли он то, что искал? Если не нашел, то сколько раз ему пришлось перефразировать запрос, чтобы найти искомое? Насколько актуальную информацию он смог найти? Насколько быстро обрабатывала запрос поисковая машина? Насколько удобно были представлены результаты поиска? Был ли искомый результат первым или же сотым? Как много ненужного мусора было найдено наравне с полезной информацией? Найдется ли нужная информация, при обращении к поисковой системе, скажем, через неделю, или через месяц?

    Для того, чтобы удовлетворить ответами все эти вопросы, разработчики поисковых машин постоянно совершенствуют алгоритмы и принципы поиска, добавляют новые функции и возможности, всячески пытаются ускорить работу системы.

    3. Основные характеристики поисковой системы

    Опишем основные характеристики поисковых систем:

    Полнота — одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. К примеру, если в Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль», а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, тем меньше вероятность того, что пользователь не найдет нужный ему документ, при условии, что он вообще существует в Интернете.

    Точность — еще одна основная характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.

    Актуальность — не менее важная составляющая поиска, которая характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых систем так называемой «быстрой базы», которая обновляется несколько раз в день.

    Скорость поиска тесно связана с его устойчивостью к нагрузкам. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.

    Наглядность представления результатов является важным компонентом удобного поиска. По большинству запросов поисковая машина находит сотни, а то и тысячи документов. Вследствие нечеткости составления запросов или неточности поиска, даже первые страницы выдачи не всегда содержат только нужную информацию. Это означает, что пользователю зачастую приходится производить свой собственный поиск внутри найденного списка. Различные элементы страницы выдачи поисковой системы помогают ориентироваться в результатах поиска подробные пояснения по странице результатов поиска, например у «Яндекса» можно посмотреть по ссылке http://help.yandex.ru/search/? >

    4. Состав и принципы работы поисковой системы

    Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.

    Модуль индексирования

    Модуль индексирования состоит из трех вспомогательных программ (роботов):

    Spider (паук) — программа, предназначенная для скачивания веб-страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Скачивается html_код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Работает «паук» следующим образом. Робот на сервер передает запрос «get/path/document» и некоторые другие команды HTTP_запроса. В ответ робот получает текстовый поток, содержащий служебную информацию и непосредственно сам документ.

    Ссылки извлекаются из тэгов a, area, base, frame, frameset, и др. Наряду со ссылками, многими роботами обрабатываются редиректы (перенаправления). Каждая скачанная страница сохраняется в следующем формате:

    — дата, когда страница была скачана

    — http_заголовок ответа сервера

    — тело страницы (html_код)

    Crawler («путешествующий» паук) — программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствующие на странице. Его задача — определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.

    Indexer (робот- индексатор) — программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы. Анализу подвергаются различные элементы страницы, такие как текст, заголовки, ссылки структурные и стилевые особенности, специальные служебные html_теги и т.д.

    Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся страницы, извлекать ссылки на новые страницы из получаемых документов и производить полный анализ этих документов.

    База данных

    База данных, или индекс поисковой системы — это система хранения данных, информационный массив, в котором хранятся специальным образом преобразованные параметры всех скачанных и обработанных модулем индексирования документов.

    Поисковый сервер

    Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависит качество и скорость поиска.

    Поисковый сервер работает следующим образом:

    — Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информационное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде сниппета, то есть соответствующей запросу текстовой информации на странице выдачи результатов поиска).

    — Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происходит обработка данных по всем документам, в результате чего, для каждого документа рассчитывается собственный рейтинг, характеризующий релевантность запроса, введенного пользователем, и различных составляющих этого документа, хранящихся в индексе поисковой системы.

    — В зависимости от выбора пользователя этот рейтинг может быть скорректирован дополнительными условиями (например, так называемый «расширенный поиск»).

    — Далее генерируется сниппет, то есть, для каждого найденного документа из таблицы документов извлекаются заголовок, краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, причем найденные слова подсвечиваются.

    — Полученные результаты поиска передаются пользователю в виде SERP (Search Engine Result Page) — страницы выдачи поисковых результатов.

    Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.

    Запрос поступает в поисковую систему через маршрутизатор Cisco 6000 series. Cisco передает его наименее загруженной машине первого уровня — frontend (1.1 — 1.3, на рис. машине 1.3). Frontend, в свою очередь, отправляет запрос дальше, на один из восьми proxy_серверов, также выбирая наиболее свободный сервер (2.1 — 2.8, на рис. машине 2.2). Одновременно frontend отправляет запрос на машины, осуществляющие поиск по товарам (3.1 — 3.2, на рис. машине 3.1) и по базе Тор 100 (4.1 — 4.2, на рис. машине 4.1). На proxy проводится поиск по ссылочному индексу, и его результаты вместе с поисковым запросом передаются на машины, которые содержат основную индексную базу, — backends (5.1.х — 5.7.х, на рис. машинам 5.1.2, 5.2.11, 5.3.1 и т.д.) Та же информация отправляется на машины с «быстрой базой» (6.1 — 6.2).

    На текущий момент в поиск включено 77 backend’ов. Они сгруппированы по 11 машин, и каждая группа содержит копию одной из частей поискового индекса. Таким образом, информация о сайтах, условно входящих в красный сектор Интернета, находится на backend’ах первой группы (5.1.1 — 5.1.11 на рис), оранжевый сектор — на backend’ах второй группы (5.2.1 — 5.2.11) и т.д. Proxy_сервер выбирает наименее загруженный backend в каждой группе машин и отправляет на него поисковый запрос с результатами ссылочного поиска. На backend’ах осуществляется поиск по частям индексной базы и ранжирование с учетом результатов поиска по ссылочному индексу. При ранжировании для всех найденных документов высчитываются веса по конкретному запросу.

    После того, как запрос обработан на backend’ах, информация о результатах и ранжировании отдается обратно на proxy_сервер. Туда же поступают отсортированные результаты с машин «быстрой базы». Proxy интегрирует данные, полученные с восьми машин: клеит дубли, объединяет зеркала сайтов, переранжирует документы в общий список по весам, рассчитанным на backend’ах. Так, первым в списке найденного может быть документ с машины 5.3.1, вторым и третьим — с 6.1, четвертым — с 5.5.2 и т.д. На proxy_сервере также реализуется построение цитат к документам и подсветка слов запроса в тексте. Полученные результаты отдаются на frontend.

    Помимо информации с proxy_сервера, frontend получает результаты из поиска по товарам и из базы Тор 100, отсортированные, с цитатами и подсветкой слов запроса. Frontend осуществляет окончательное объединение результатов, генерирует html со списком найденного, вставляет баннеры и перевязки (ссылки на различные разделы Рамблера) и отдает html Cisco, который маршрутизирует информацию пользователю.

    5. Что умеет Яndex

    Программные продукты серии Яndex (Языковый index) — набор средств полнотекстовой индексации и поиска в текстовых данных с учетом морфологии русского языка.

    Яndex включает модули морфологического анализа и синтеза, индексации и поиска, а также набор вспомогательных модулей, таких, как анализатор документов, языки разметки, конверторы форматов, сетевой «паук».

    Алгоритмы морфологического анализа и синтеза, основанные на базовом словаре, умеют нормализовать слова, то есть находить их начальную форму, а также строить гипотезы для слов, не содержащихся в базовом словаре. Система полнотекстового индексирования позволяет создавать компактный индекс и быстро осуществлять поиск с учетом логических операторов.

    Яndex предназначен для работы с текстами как в локальной так и в глобальной сети (технологии Intranet и Internet), а также может быть подключен как модуль к другим системам.

    Создаваемый индекс составляет около 1/3 объема текста (без картинок, tag’ов и пр.), при этом записывается подробный адрес слова — с точностью до позиции в тексте, что потом позволяет искать с учетом близости. В базу входят нормализованные формы слов текста, сами документы не хранятся.

    Морфологический анализ слов текста происходит одновременно с индексацией, что дает возможность снятия омонимии.

    Скорость индексации — не менее 2 Мб/минуту. Написан свой робот для обхода Web’а.

    Организация изменения индекса (полное либо частичное обновление, слияние).

    Идет индексирование по всем словам, стоп-слова определяются статистически.

    Язык запросов: скобки; логическое И (в пределах одного абзаца); логическое ИЛИ; оператор И НЕ (в пределах одного абзаца); близость — расстояние в словах.

    Список выданных документов упорядочивается по релевантности — по количеству найденных слов. В каждом документе выделяются (подсвечиваются) найденные слова.

    3. Работа с языком

    Для интеллектуализации поиска используется словарь на 90 тыс. слов. При индексации происходит нормализация, то есть слово ставится в свою исходную форму (для существительных — именительный падеж единственного числа, для глаголов — неопределенная форма и т.д.) и в таком виде учитывается в базе. Алгоритм морфологического разбора умеет корректно обрабатывать и слова, не найденные в словаре. Морфология работает для русского и английского языка. Также индексируются числа.

    На странице результатов поиска Яндекса есть тексты, поясняющие результаты поиска, и ссылки, дающие возможность сортировать найденное или уточнять запрос. Ниже приведен общий вид страницы результатов.

    Если в результате запроса Яндекс нашел много документов, но по более широкой теме, чем вам хочется, вы можете сократить этот список, уточнив запрос. Еще один вариант — включить флажок в найденном в форме поиска, задать дополнительные ключевые слова, и следующий поиск будет вестись только по тем документам, которые были отобраны в предыдущем поиске. Например, чтобы найти страницы про кондиционеры — средства, предназначенные для ухода за волосами (а не климатическую технику), можно задать запрос кондиционеры, для определения области поиска. А затем, поставив галочку в найденном, — слово «волосы».

    Область поиска

    Под формой поиска могут появляться несколько дополнительных блоков.

    Адрес сайта

    Яндекс позволяет искать информацию только по интересующему вас сайту, задав соответствующие параметры в расширенном поиске, с помощью Яндекс. Бара или нажав на ссылку «Еще с сайта». Тогда рядом с поисковой формой появляется напоминание, что результаты получены поиском по одному сайту. Если вы хотите продолжить поиск по всем сайтам, достаточно перед очередным запросом снять флажок….

    Выбор региона

    Поиск можно ограничить сайтами в нужном вам регионе или относящимися к интересной вам теме. Для поиска по всем сайтам снимите флажок в регионе.

    Выбор диапазона дат

    Задав временной интервал, к которому должны относиться искомые документы, вы можете затем его исправить в результатах поиска, введя новые числа в формате «День-Месяц-Год».

    Ссылки над поисковой формой

    Над формой поиска видны две ссылки. Ссылка «Помощь» ведет на описание возможностей поиска. По ссылке «Настройка поиска», вы сможете изменить вид страницы с результатами поиска по своему вкусу, включить семейный поиск и отключить показ графической рекламы. Ссылка справа от формы поиска ведет на расширенный поиск, позволяющий даже неопытному пользователю задавать сложные поисковые запросы.

    Параллельные поиски

    Яндекс умеет искать не только сайты, но и новости, товары, картинки и т.д. Когда вы задаете запрос, поиск ведется одновременно по всем «параллельным» базам, и если что-либо найдено, Яндекс покажет информацию среди результатов поиска. В правой колонке — товары и картинки, внизу или вверху страницы — новости, словари, карты, афиша, погода.

    Пролог результатов поиска

    Вверху списка найденных документов выдается статистика слов запроса и найденных документов.

    Статистика запросов

    Статистика запросов показывает, сколько раз в течение предыдущего месяца в запросах пользователей содержалось то или иное слово.

    Пример:

    Запросов за месяц: красота — 114 851, спасет — 5 990, мир — 457 079.

    Статистика найденных страниц

    Статистика результатов поиска позволяет узнать количество найденных по запросу страниц и число сайтов, на которых они располагаются. Эти показатели примерные и могут меняться.

    Пример:

    Результат поиска: страниц — 140, сайтов — не менее 96

    Статистика слов

    Статистика слов в базе Яндекса показывается, только если вы указали это в настройках. Она говорит о том, сколько раз встретилось каждое из слов запроса на всех страницах, известных Яндексу. Этот показатель примерный и может меняться.

    Область поиска

    Если в поиске по запросу участвовали не все проиндексированные страницы, в области поиска показываются эти ограничения. В их число входят ограничение по региону, сайту, языку, формату документа, страницы, похожие на заданную, включенный семейный фильтр.

    Рубрики Каталога и Маркета

    Когда запросу соответствуют рубрики каталога или Яндекс. Маркета, перед результатами поиска выводятся ссылки на соответствующие рубрики. Такое совпадение характерно для запросов, охватывающих широкую тему (таких как кондиционеры, открытки), и каталог сайтов или товаров — хорошее место, чтобы найти сайт с информацией или сделать покупку.

    Ответы «параллельных» поисков

    Многие службы Яндекса «понимают», когда они могут дать хороший ответ на запрос, и показывают соответствующую информацию в прологе результатов поиска.

    Яндекс. Карты:

    Яндекс. Афиша:

    Яндекс. Погода:

    Яндекс. Словари:

    «Колдунщик»

    Когда поиск принес мало документов, Яндекс анализирует запрос и предлагает способ, которым можно улучшить результаты. Мы называем этот модуль «колдунщиком».

    Найденный документ

    Заголовок документа

    Заголовок документа отражает название документа, данное ему автором страницы. При нажатии на него откроется сам документ (в зависимости от настроек, в новом или том же окне. Если вместо заголовка показывается адрес страницы, значит, ее заголовок (title) не задан.

    Найденные слова

    Ссылка «Найденные слова» открывает окно, в котором в тексте найденного документа цветом фона подсвечены слова запроса. Красные стрелки рядом с каждым словом позволяют передвигаться вперед-назад по списку найденных слов. Ссылки «первое слово» и «последнее слово» дают возможность найти первое и последнее вхождение слов запроса в текст документа. Ссылка «Посмотреть сохраненную копию» показывает текст документа (без форматирования) в том виде, в каком он был в момент индексации. Даже если оригинал документа не открывается, или был изменен, вы всегда можете увидеть его копию. Ссылка «Найти похожие документы» аналогична ссылке Похожие документы в результатах поиска.

    Фрагмент текста

    Аннотация документа составляется на основе его текста, из которого извлекаются предложения или их части, содержащие слова запроса. Если Яндекс считает такое описание недостаточно информативным, оно может быть дополнено описанием страницы, которое составил ее владелец (тег meta description), или заменено на описание сайта из каталога. Когда сайт найден по ссылкам, в качестве описания приводятся тексты ссылок.

    Пример:

    По запросу поисковая система главная страница Яндекса в результатах имеет описание:

    текст ссылок: Яндекс поисковая система по русскому интернету… поисковая система Yandex поисковый сервер для русского интернета…

    Это значит, что на странице yandex.ru нет фразы поисковая система, но на эту страницу так часто ссылаются.

    Статус документа

    Под описанием документа выдается информация о нем:

    — адрес страницы сайта, наиболее соответствующей запросу;

    — размер страницы;

    — дата последнего изменения страницы, если сервер ее выдает;

    — мера соответствия страницы запросу.

    Тема сайта

    Если найденная страница расположена на сайте, зарегистрированном в каталоге Яндекса, то под описанием документа отображается рубрика каталога, которой он принадлежит. Перейдя по этой ссылке, вы попадете в соответствующий раздел каталога.

    Похожие документы

    Ссылка «Похожие документы» позволяет найти страницы, которые похожи на выбранную вами и могут отвечать на запрос столь же хорошо. Если страница-образец уже удалена с сайта, Яндекс выдаст сообщение: «Запрошенный(е) документ(ы) не найден(ы)». По умолчанию ссылка не показывается, включить ее отображением можно в настройках поиска. Вы также можете искать похожие документы в форме расширенного поиска.

    Еще с сайта.

    Ссылка «Еще с сайта» позволяет увидеть все документы с выбранного сайта, соответствующие запросу. Вы также можете задать ограничения по сайту в форме расширенного поиска.

    Другие страницы с результатами поиска

    Если вам недостаточно первых десяти ссылок (или более) на первой странице результатов, вы можете просмотреть другие страницы. Ссылки «предыдущая» и «следующая» — переход на страницу, предшествующую или следующую за текущей. Ряд чисел, оформленных в виде ссылок, позволяет перейти сразу на нужную страницу результатов поиска. Многоточие в конце списка страниц — переход на страницу, следующую за перечисленными в списке.

    Сортировка результатов

    Вы можете отсортировать найденные страницы одним из двух способов:

    — по степени их соответствия запросу (релевантности);

    — по дате последнего изменения документа.

    По умолчанию сортировка идет по релевантности, а сортировка по дате нужна, как правило, только когда вы ищете максимально свежие документы.

    Регионы найденных сайтов

    Каждый раз, получая ваш запрос, Яндекс определяет, к каким регионам относятся найденные сайты. Нажав на одну из ссылок с названием нужного региона, вы отберете только те сайты, которые к нему относятся.

    Темы найденных сайтов

    Яндекс показывает темы (названия рубрик каталога), к которым относится большая часть сайтов, найденных по запросу. Жирным шрифтом выделены рубрики верхнего уровня, в скобках приведены подрубрики. Нажав на одну из ссылок, вы отберете только те сайты, которые относятся к заданной теме.

    Пример:

    Вы хотите найти информацию об эфирных и косметических маслах (а не моторных маслах). Задав запрос масло, выберите дальше рубрику «Народная и нетрадиционная медицина».

    Как выбор темы сайтов, так и выбор региона заметно сужают область поиска, поэтому их эффективно применять для запросов, которые принесли слишком много результатов.

    Заключение

    В наше время информация играет огромную роль во всех сферах жизнедеятельности. Людям, имеющим дело с большими объемами текстов — это и новости, и подшивки газет в электронном виде, и электронная почта, и Web_страницы, важно быстро находить в этом море информации действительно нужную. Без помощи поисковой системы это было бы нереально. Благодаря удобству в обращении и хорошим техническим характеристикам, различные поисковые системы могут помочь в этом и новичку, и опытному пользователю.

    Поисковые системы и существующие к ним приложения, способны облегчить работу представителей многих профессий: Web_мастера, аналитика, руководителя, лингвиста. Информационный бум продолжается, происходит дальнейшее развитие электронно-компьютерных технологий, а следовательно и в будущем без поисковых систем обойтись будет крайне сложно.

    Итак, первоочередная задача любой поисковой системы — доставлять людям именно ту информацию, которую они ищут.

    Основные характеристики, которыми должны обладать поисковые системы:

    — Полнота — Представляет собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих запросу.

    — Точность — Определяется степенью соответствия найденных документов запросу

    — Актуальность — Характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу системы.

    — Скорость поиска — Скорость поиска тесно связана с его устойчивостью к нагрузкам. Посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.

    — Наглядность — Наглядность представления результатов является важным компонентом удобного поиска. По большинству запросов поисковая машина находит сотни, а то и тысячи документов. Вследствие нечеткости составления запросов или неточности поиска, даже первые страницы выдачи не всегда содержат только нужную информацию. Это означает, что зачастую приходится производить свой собственный поиск внутри найденного списка.

    Лидер среди русскоязычных поисковых систем — Яндекс — индексирует документы форматов pdf, rtf, doc, txt, swf, rss и так далее. С помощью Яндекса можно искать информацию не только на русском и других языках.

    В настоящее время, практически каждая поисковая система имеет свои механизмы расчета рейтинга Интернет-страниц, и алгоритмы эти постоянно изменяются, совершенствуются. Однако в целом можно сказать, что наибольшее внимание современные поисковики уделяют внешним критериям оценки релевантности.

    Компактная форма выдачи результатов и рациональный дизайн Яндекса делают ее весьма удобной, когда нужно просмотреть десятки страниц со ссылками. Однако релевантность найденных ссылок не всегда высока и потому часто требуется использование расширенного поиска для уточнения запроса.

    Список литературы

    1. Е. Колмановская, CompTek International, Яndex: система русского поиска Internet/Intranet.

    2. Абросимов А.Г., Абрамов Н.В., Мотовилов Н.В., Корпоративные экономические информационные системы, уч. пос. СГЭА, 2005.

    3. Талантов М. Поиск информации в Интернете: подводные камни // КомпьютерПресс. — №9, 1999.

    4. Троян Г.М. Поиск в русскоязычной части Интернет: поисковая система Rambler // Радиолюбитель. Ваш компьютер. — №8-10, 1999.

    5. Троян Г.М. Поиск в русскоязычной части Интернет: поисковая система Yandex // Радиолюбитель. Ваш компьютер. — №1-3, 2000.

    6. Современный самоучитель работы в сети Интернет. Самые популярные программы: Практ. пособ. — Под ред. Комягина В.Б. — М.: Издательство «Триумф», 1999. — 368 с.

    7. Таненбаум Э. Компьютерные сети. Спб.: «Питер», 2002.

    8. Петров, В.Н. Информационные системы — СПб.: Питер — 2003.

    9. Косарев, В.П., Еремин, Л.В. Экономическая информатика — Москва: Финансы и статистика — 2002.

    10. Семакин, И.Г., Хеннер, Е.К. Информационные системы и модели — Москва: БИНОМ — 2005.

    11. Справочная информация по сетям ЭВМ и телекоммуникациям www.index.com

    13. http://www.oqbo.ru/read.php? block=4

    Размещено на Allbest.ru

    Подобные документы

    Поисковая система "Яндекс"

    Рассмотрение принципов поисковой системы и процедуры проведения поиска по запросам пользователей "Яндекса". Изучение структуры запросов, вспомогательных программ поиска, модулей и этапов их преобразования. Описание дополнительной информации в сниппете.

    Анализ существующих информационно-поисковых систем

    Понятие информационно-поисковых систем, их сущность и особенности, история возникновения и развития, роль на современном этапе. Внутреннее устройство и элементы поисковой системы. Принцип работы поисковой машины Рамблер, прядок обработки запроса.

    Поисковая система Яндекс

    Яндекс как крупнейшая российская поисковая система и интернет-портал, история появления. Поиск системы: охват форматов, язык запросов. Мультимедийно-поисковые, рыночно-поисковые, справочно-информационные, рекламные и персонализированные веб-сервисы.

    Поиск в интернете: поисковые системы Яндекс и Google

    Анализ возможностей поисковых систем Яндекс и Google, их сравнение с точки зрения полезности. История создания поисковых систем, характеристика их интерфейса, поисковых инструментов и алгоритмов. Формирование вопроса и критерий к ответу на него.

    Программа "Поисковая система на основе хэш-таблиц"

    Основные методы объектно-ориентированного программирования поисковой системы. Выбор языка программирования и среды разработки приложения. Реализация паттерна, использование принципа сохраняемости. Описание пользовательского интерфейса поисковой системы.

    Понятие и принципы работы, внутренняя структура и элементы, история формирования и развития поисковой системы "Rambler". Исследование и анализ, а также оценка эффективности данной поисковой системы для поиска экономической информации в интернете.

    Поисковая система "Яндекс"

    Система поиска в сети и интернет-портал "Яндекс". Образование компании "Яндекс" в 2000 году, ее выход на самоокупаемость в 2002 году. Основное и приоритетное направление компании — разработка поискового механизма. Порядок введения запроса, его диапазон.

    Поиск информации в интернете. Поисковая система Яндекс

    Информационная поисковая система Яндекс; характеристика услуг и сервисов портала: каталог, новости, города, энциклопедии. Полезные ссылки главной страницы. Формирование и активизация поискового запроса: морфология, контекст, порядок слов, результат.

    Методология RAD разработки информационных систем

    Определение RAD, ее сущность и особенности, основные принципы и методики, назначение, история становления и развития. Причины популярности RAD на современном этапе, ее преимущества и отличительные черты, сферы применения и инструментальные средства.

    Информационно-поисковая система

    Основные источники информации, представленные в Интернете. Каталог — поисковая система с классифицированным по темам списком аннотаций со ссылками на web-ресурсы. Особенности поисковой и метапоисковой машины. Архитектура современных ИПС для WWW.

    Основы информационных технологий

    Понятие и содержание информационной технологии на современном этапе, ассортимент изделий данной группы на рынке. Объекты информационных технологий и результаты их работы. Средства и методы информационных технологий, особенности и сферы их применения.

    Анализ информационной системы формирования заявок в ЦРТ сервис

    Принципы и основные этапы проектирования информационной системы, требования к ее функционалу и оценка возможностей, сферы практического применения. Анализ и обоснование используемого программного обеспечения и технических средств. Листинг программы.

    Поисковая система Google

    Обеспечение высокой релевантности поиска с помощью поисковой системы Google. Быстрота и надежность работы, большее количество ссылок в русскоязычном секторе Интернета. Службы, отсутствующие у других поисковых систем. Google как законодатель моды.

    Выбор информационной системы

    Методы выбора информационной системы, используемое в процессе его разработки программы, а также основные технические средства. Анализ полезности использования экспертной системы и оценка ее необходимости, сферы и особенности практического применения.

    Поисковые системы Интернета

    Определение программного и математического обеспечения ИС. Виды запросов к базам данных в СУБД. Поисковые системы Интернет. Описание принципа работы поисковых систем Яндекс, Рамблер, Апорт. Особенности пересылки файлов средствами электронной почты.

    Информационно-поисковая система поликлиники

    Создание специального программного приложения, способного вести поисковую систему необходимой нам информации. Требования к данной информационной системе, ее функциональные особенности и сферы практического применения. Выбор и обоснование языка и среды.

    Доходы поисковых систем

    Контекстная реклама как основная статья дохода поисковых систем-лидеров. Понятие цены клика. Формирование цены на основе частот запросов (на примере поисковой системы Рамблер). Основные поисковые системы на российском рынке, перспективы их развития.

    Экспертные системы

    Экспертные системы как самостоятельное направление в исследованиях по искусственному интеллекту, история его зарождения и развития, главные цели и оценка важности. Сферы применения экспертных систем и причины их коммерческого успеха, перспективы.

    Позиционирование БГИТА в геоинформационных системах

    Составные части географической информационной системы (ГИС). Задачи, которые решает ГИС. Системы настольного картографирования. Примеры электронных карт. Добавление фотографий на Google Maps, Google+, Яндекс.Фотки, Яндекс.Народная карта, Wikimapia.

    Разработка информационной системы автоматизации рабочего места библиотекаря

    Разработка информационной системы для ведения каталога книг/читателей, поисковой системы, предварительных заказов на приобретение книг. Анализ затрат на разработку системы. Архитектура объектно-ориентированной системы. Диаграмма классов, модули системы.

    • главная
    • рубрики
    • по алфавиту
    • вернуться в начало страницы
    • вернуться к началу текста
    • вернуться к подобным работам
    • весь список подобных работ
    • скачать работу можно здесь
    • сколько стоит заказать работу?

    Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
    PPT, PPTX и PDF-файлы представлены только в архивах.
    Рекомендуем скачать работу.

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *