Представитель Мегапьютер выступил с докладом «Большая языковая модель + классический text mining: гибридный подход для...
ДалееВ видео продемонстрирован один из вариантов применения инструментов текстового анализа NLP для массовой интеллектуальной обработки электронных таблиц. На примере нескольких таблиц Excel, содержащих отчет по исполнению бюджета одного из регионов России проводится пакетная загрузка наборов таблиц.
Далее ML модели под капотом PolyAnalyst разбирают таблицы, как текстово-табличные документы. Это позволяет применять NLP инструменты, в частности проводить извлечение из таблиц сущностей (денежные суммы, компании, геоадминистративные объекты, даты и т.д.).
Что самое важное, аналитик может задавать правила для извлечения элементов таблиц (колонок, строк, ячеек) со специфическим содержимым. Для примера демонстрируется, как можно извлекать суммы дохода по статьям, содержащим акцизные сборы за продажу всевозможных продуктов нефтепереработки (бензина, дизеля, газойля и т.д.). Для этого возможно использовать встроенный в систему менеджер словарей, где создаются необходимые справочники (в данном кейсе справочник продуктов нефтепереработки) и с помощью однострочного правила обрабатывать одновременно сотни таблиц.
Представитель Мегапьютер выступил с докладом «Большая языковая модель + классический text mining: гибридный подход для...
ДалееКомпания Мегапьютер продолжает новую рубрику “PolyAnalyst Podcast” Выпуск 3. PolyAnalyst vs. Excel. Компания «Мегапьютер» продолжает...
ДалееИнструменты интеллектуального анализа и поиска по текстовым данным с применением технологии RAG. RAG (Retrieval Augmented...
Далее