«Табличные данные» - это широкий термин, охватывающий структурированные данные, которые обычно помещаются в определенную строку и столбец. Это может быть база данных SQL, электронная таблица, файл .CSV и т. д. Несмотря на огромный прогресс в области искусственного интеллекта, применяемого к неструктурированным и последовательным данным, эти большие языковые модели (LLM) являются нечеткими по своей природе.
Они построены таким образом, чтобы манипулировать входными лексемами для создания связного вывода без обязательного следования фиксированной структуре. Кроме того, доступ к лучшим LLM через API или запуск в собственной облачной инфраструктуре обходятся недешево. И все же многие компании уже имеют стратегию работы с данными: хранилище данных или озеро данных для централизации всех важных данных и несколько специалистов по изучению данных, которые могут использовать эти данные для улучшения стратегии компании.
Французский стартап Neuralk-AI - это компания, занимающаяся искусственным интеллектом, которая работает над моделями ИИ, ориентированными на табличные данные. На этой неделе компания объявила о финансировании в размере 4 миллионов долларов. «Данные, имеющие реальную ценность для компаний, - это данные, которые были определены давным-давно, структурированы в виде таблицы и используются специалистами по обработке данных этих компаний для создания всех алгоритмов машинного обучения», - сказал TechCrunch соучредитель и главный научный сотрудник Neuralk-AI Александр Паскью (Alexandre Pasquiou).
Neuralk-AI считает, что существует возможность вернуться к разработке моделей ИИ, но с особым упором на структурированные данные. Сначала компания планирует предложить свою модель в виде API специалистам по анализу данных, работающим в торговых компаниях, поскольку эти компании любят данные - каталоги товаров, базы данных клиентов, тенденции развития корзин и т. д. «Сегодня LLM отлично подходит для поиска, естественного взаимодействия с пользователем и ответов на вопросы на основе неструктурированных документов.
Но они имеют некоторые ограничения, как только мы возвращаемся к классическому машинному обучению, которое действительно основано на классических табличных данных», - говорит Паскуиу. С помощью Neuralk-AI ритейлеры могут автоматизировать сложные процессы обработки данных с помощью интеллектуальной дедупликации и обогащения. Кроме того, они могут использовать модели компании для выявления мошенничества, оптимизации рекомендаций по товарам и составления прогнозов продаж, которые можно использовать для управления запасами и ценообразования на товары.
Fly Ventures возглавила раунд в размере 4 миллионов долларов, в котором также участвовала компания Steam AI. В стартап также инвестировали несколько бизнес-ангелов: Томас Вольф из Hugging Face, Чарльз Горинтин из Alan, а также Филипп Коррот и Наги Летайфа из Mirakl. Команда все еще активно работает над своими моделями.
Она планирует провести тестирование с группой ведущих французских ритейлеров и торговых стартапов, таких как E.Leclerc, Auchan, Mirakl и Lucky Cart. «В течение трех-четырех месяцев мы выпустим первую версию нашей модели и публичный бенчмарк, по которому мы сможем оценить нашу модель в сравнении с передовыми разработками в этой области», - сказал Паскью. «В сентябре мы планируем стать лучшей моделью табличного фундамента во всем, что связано с обучением представлениям».
Оригинал
Уникальность