Векторная база данных · Нетехнический технический словарь

Представь лучшего продавца в музыкальном магазине, которого ты встречал. Ты не знаешь названия песни, которая застряла в голове, поэтому напеваешь восемь тактов, плохо, а он говорит: "а, тебе вот это" — и вытаскивает нужную пластинку. Ты не сказал название. Не сказал исполнителя. Ты дал ему вайб, и он сразу пошел к правильной полке.

Обычная база данных так не умеет. Векторная база данных как раз для этого и создана.

Сначала главное разделение. Обычная база данных — буквалист. Она отвечает на точные вопросы, и только на точные:

"Найди клиента по имени Smith."
"Вытащи все заказы дороже $100."
"Дай строку с таким ID."

Написал правильно — идеально. Написал с ошибкой или спросил что-то размытое — она пожимает плечами. Она сопоставляет символы, а не смысл. Для обычной базы "заказ потерялся" и "моя посылка так и не пришла" — два совершенно чужих предложения. Общих слов ноль, значит совпадение ноль.

Векторная база данных думает наоборот. Она не спрашивает "у них одни и те же слова?". Она спрашивает: "они примерно про одно и то же?" И этот один сдвиг — вся суть.

Как она проворачивает трюк с напетой песней. Перед тем как что-то попадает внутрь, каждый кусок текста превращается в длинную цепочку чисел, которая отражает его смысл (это преобразование — отдельная штука, достойная своего дня). Не переживай о математике. Просто представь, что каждое предложение, документ и тикет поддержки падает одной точкой на гигантскую карту. Похожие по смыслу вещи приземляются рядом. Совсем непохожие — на разных концах карты.

На этой карте:

"моя посылка не пришла" и "заказ потерялся" лежат почти друг на друге
"мне нравится упаковка" оказывается далеко на другом конце города
"какая у вас политика возврата" сидит где-то отдельно

Векторная база данных хранит миллионы таких точек и в момент, когда ты спрашиваешь, находит те, что сидят ближе всего к тому, что ты только что ей дал. Ты даешь новое предложение, она ставит свежую точку на карту, оглядывается и забирает ближайших соседей. Ближе на карте значит ближе по смыслу. Это вся задача.

Где ты уже это чувствовал. Это двигатель под AI, который "знает" твои материалы. Когда ты загружаешь кучу документов, а AI отвечает на вопрос по ним, он почти никогда не читает их все. Не может. Они не поместятся в комнату. Вместо этого:

Твой вопрос падает на карту как точка.
Векторная база данных забирает несколько фрагментов, которые лежат ближе всего к нему (релевантные куски, а не всю библиотеку).
Они передаются модели, и модель пишет ответ на их основе.

Модное название этого цикла — RAG, retrieval-augmented generation, и ты будешь слышать его постоянно. Если снять жаргон, останется просто: сначала принеси релевантные страницы, потом отвечай. Векторная база данных — часть, которая приносит. И приносит по смыслу, а не по ключевому слову. Поэтому она может вытащить правильный абзац, даже если твой вопрос и абзац не совпадают ни одним словом.

Одна честная оговорка, потому что это та же ловушка, что и везде в AI. "Ближе по смыслу" — это лучшее предположение, а не гарантия. Векторная база данных возвращает то, что ближе всего, но ближайшее не всегда правильное. Спроси о том, чего в твоих документах реально нет, и она все равно бодро вернет самые близкие точки, какие найдет, а они могут быть близки к чему угодно, только не к полезному ответу. Мусор, который рядом с твоим вопросом, все равно мусор. Поэтому когда AI отвечает по твоим файлам, а ответ кажется чуть мимо, часто ошибка именно здесь: он достал страницы, которые выглядели ближайшими, а не правильные.

Чистый способ держать разницу в голове:

Обычная база данных находит строку, которая совпадает.
Векторная база данных находит строки, которые значат то же самое, даже если сказаны совершенно другими словами.

Одна — буквалист с картотекой. Другая — продавец, который слышит восемь плохих тактов и идет прямо к нужной полке.