2
Whoosh
Whoosh е библиотека от класове и функции за индексиране на текст и след това търсене в индекса.Тя ви позволява да разработвате персонализирани търсачки за вашето съдържание.
- Безплатно
- Self-Hosted
Whoosh е бърза, функционална библиотека за пълно текстово индексиране и търсене, реализирана в чист Python.Програмистите могат да го използват за лесно добавяне на функционалност за търсене към своите приложения и уебсайтове.Всяка част от начина, по който работи Whoosh, може да бъде разширена или заменена, за да задоволи точно вашите нужди.Някои от функциите на Whoosh включват: Pythonic API.Pure-Python.Не са необходими компилация или двоични пакети, няма мистериозни сривове.Полево индексиране и търсене.Бързо индексиране и извличане - по-бързо от всяко друго решение за търсене на чист Python, което познавам.Вижте Бенчмарки.Алгоритъм за включване на ток (включително BM25F), анализ на текст, съхранение, формат за публикуване и т.н. Мощен език за заявки.Качествен за проверка на правописа на чист Python (доколкото знам, единственият).... Whoosh може да бъде полезен при следните обстоятелства: Навсякъде е желателно решение с чист Python, за да се избегне необходимостта от изграждане / компилация на родните библиотеки (или принуждаване на потребителите да ги изграждат / компилират).Като изследователска платформа (поне за програмисти, които намират Python за по-лесно четене и работа с Java;) Когато лесният за използване Pythonic интерфейс е по-важен за вас, отколкото суровата скорост.Ако вашето приложение може да се възползва добре от едно дълбоко интегрирано решение за търсене / търсене, можете да разчитате само на това, че сте там, а не на две различни решения за търсене (обикновено / бавно / вградено едно интегрирано, индексирана / бърза / външна двоична зависимост едно катоопция).Whoosh е създаден и се поддържа от Мат Чапут.Първоначално той е създаден за използване в онлайн системата за помощ на софтуера за 3D анимация на софтуер за странични ефекти Houdini.Side Effects Software Inc. любезно се съгласи да отвори код с отворен код.