Дискуссионный математический форумМатематический форум
Математический форум Math Help Planet

Обсуждение и решение задач по математике, физике, химии, экономике

Теоретический раздел
Часовой пояс: UTC + 3 часа [ Летнее время ]
новый онлайн-сервис
число, сумма и дата прописью

Часовой пояс: UTC + 3 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ 1 сообщение ] 
Автор Сообщение
 Заголовок сообщения: Индексация огромных данных
СообщениеДобавлено: 12 окт 2012, 16:33 
Не в сети
Начинающий
Зарегистрирован:
12 окт 2012, 14:25
Сообщений: 1
Cпасибо сказано: 0
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
Здравствуйте.

Я не далекий от математического склада ума, однако совершенно точно не специалист в этой науке. Меня интересует математическое описание (или представление) оптимизации представления данных для быстрого поиска.

Господа, как работает бинарный алгоритм поиска и BTree-индексы, думаю, прекрасно понимают даже школьники))
С другой стороны, как работают индексирование поисковых машин (гугл, твиттер, яндекс) и баз данных, которые оперируют огромнейшими данными, и как достигается такой невероятный выбор информации - для меня совершенно неясно. Свои пробелы я хочу восполнить в полезной и интересной здесь дискуссии :)

Теперь простое наблюдение. Написав любую статью (по размеру), возможно даже книгу, и выложишь ее на сайте - гугл в течении нескольких дней ее проиндексируют. После чего, если обратиться к поиску по точной фразе (набрать необходимо в кавычках) из любой части текста, поисковик найдет указанное предложение меньше чем за четверть секунды.
За четверть секунды был произведен отбор в почти безграничном объеме информации интернета.

Меня невероятно интригует, как и что происходит в данный момент с математической точки зрения. Буду рад побеседовать.

(внимание, идею с кэшем сразу отбросим, ибо запрос можно составить абсолютно уникальный/некэшированный, и потому что интересует математическая сторона вопроса)

Вернуться к началу
 Профиль  
Cпасибо сказано 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему      Страница 1 из 1 [ 1 сообщение ]

 Похожие темы   Автор   Ответы   Просмотры   Последнее сообщение 
Анализ данных

в форуме MathCad

Blackmov

2

387

03 дек 2017, 16:30

Сортировки данных в c++

в форуме Информатика и Компьютерные науки

kvadratisharic

0

390

13 мар 2018, 23:18

Базы данных

в форуме Информатика и Компьютерные науки

write2levent

0

123

05 ноя 2022, 20:49

Выявление аномалий в данных

в форуме Теория вероятностей

dvader

0

189

28 окт 2017, 12:23

Статистическое исследование данных

в форуме Математическая статистика и Эконометрика

oxana22

3

312

03 апр 2015, 11:01

Статистическая обработка данных

в форуме Математическая статистика и Эконометрика

Chick_chirick

4

613

02 апр 2018, 11:30

Статистическая обработка данных

в форуме Математическая статистика и Эконометрика

IamGandalf

10

1103

14 дек 2015, 22:01

Обработка экспериментальных данных

в форуме Информатика и Компьютерные науки

doriangrayos

0

537

02 июн 2016, 11:32

Анализ полученных данных

в форуме Математическая статистика и Эконометрика

Vick_Kama

1

274

05 дек 2016, 22:39

Линейная аппроксимация данных

в форуме Численные методы

anastasia9494

1

231

20 фев 2020, 18:53


Часовой пояс: UTC + 3 часа [ Летнее время ]



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 13


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  

Яндекс.Метрика

Copyright © 2010-2023 MathHelpPlanet.com. All rights reserved