Если уж на что и годится Raspberry Pi, так это на все понемногу. Проекты по домашней автоматизации и голосовым помощникам, безусловно, не являются чем-то неслыханным - вы можете найти довольно много проектов в Интернете. Но сегодня мы хотим поделиться впечатляющим проектом голосового помощника, созданного с нуля, который, на наш взгляд, действительно впечатляет. Мейкер и разработчик Сурьятеджадев создал собственный голосовой помощник, используя наш любимый одноплатный компьютер (SBC) Raspberry Pi 5, а также немного помощи от искусственного интеллекта благодаря ChatGPT.
Концепция проста, но очевидно, что для ее реализации потребовалось немало усилий. Raspberry Pi прослушивает звук с помощью микрофона. Затем этот звук обрабатывается и разбирается с помощью ChatGPT, чтобы можно было интерпретировать команду. Ответы ChatGPT могут быть воспроизведены через Raspberry Pi 5 с помощью динамика.
Эта система очень похожа на ту, что используется в коммерческих системах типа Alexa, но с дополнительным преимуществом - обходом серверов Amazon для большей конфиденциальности. В прошлом мы уже рассказывали о подобных проектах, таких как TextyMcSpeechy, который упрощает реализацию уникальных голосовых профилей в проектах голосовых помощников. Мы также видели проекты с большим количеством индивидуальности и характера, например, голосовой помощник в стиле Бендера из «Футурамы». Однако этот проект Сурьятеджадева более простой и легко реализуемый, если вы хотите сделать что-то свое.
Основной платой, питающей этот проект, является Raspberry Pi 5, мощности которого достаточно для работы с различными компонентами проекта. Однако вам все равно понадобится вентилятор для охлаждения устройства, так как Pi 5 имеет свойство нагреваться. Вы можете использовать любой совместимый микрофон для аудиовхода и любой динамик для аудиовыхода.
Raspberry Pi запрограммирован на прослушивание ключевого слова, в данном случае «корги». Когда ключевое слово обнаружено, Pi лает в ответ. Звук также может быть обнаружен с помощью телефона, используя приложение под названием «Easy Voice Recorder». Pi может прослушивать звук через это приложение, если на телефоне и Pi запущен «Syncthing». Аудио преобразуется в текст с помощью OpenAI, который затем разбирается в API ChatGPT. Ответы преобразуются в аудио с помощью модели OpenAI и затем воспроизводятся через динамик, который вы используете.
Сурьятеджадев был достаточно любезен, чтобы сделать проект с открытым исходным кодом, и поделился множеством подробностей о рабочем процессе для всех, кто хочет узнать больше. Raspberry Pi использует собственный скрипт Python для обработки входного аудиосигнала и передачи его в ChatGPT. Весь исходный код доступен на GitHub для скачивания и изучения.
Оригинал
Уникальность