Как это работает:
В рамках этого проекта вы научитесь создавать персонального ИИ-помощника по имени Кейли, который будет работать через Telegram. Кейли может обобщать непрочитанные электронные письма, проверять события в календаре, управлять задачами в Google и взаимодействовать как в голосовом, так и в текстовом режиме. Помощник предоставляет комплексное решение для управления цифровой жизнью, доступное через мессенджер Telegram.
Ключевые особенности:
- Поддерживает голосовое взаимодействие без рук
- Поддерживает память о разговорах
- Интеграция с основными сервисами Google
- Обеспечивает персонализированную помощь в управлении электронной почтой, планировании и организации задач
Шаг за шагом:
Триггер Telegram:
Рабочий процесс начинается с триггера Telegram, который отслеживает входящие сообщения. Система определяет, является ли входящее сообщение голосовым или текстовым.
Обработка голоса:
Если получено голосовое сообщение, рабочий процесс извлекает голосовой файл из Telegram и использует API транскрипции OpenAI для преобразования речи в текст.
ИИ-помощник: обработанный текст (будь то исходный текст или расшифровка аудиозаписи) передается Caylee, ИИ-помощнику на базе языковой модели OpenRouter.
Интеграция инструментов:
В распоряжении Кейли есть несколько инструментов для повышения продуктивности:
Get Email: использует Gmail API для получения непрочитанных писем из папки «Входящие» с указанием отправителя, даты, темы и краткого содержания
Календарь Google: извлекает события из календаря за указанные даты, отфильтровывая неактуальные события в будущем
Google Задачи: создание новых задач и извлечение существующих задач из списков Google Задачи
Требуемые ключи API:
- API Telegram Bot: создайте бота через @BotFather в Telegram, чтобы получить токен бота
- API OpenAI: требуется для преобразования речи в текст
- OpenRouter API: обеспечивает работу языковой модели ИИ
- Google OAuth2: требуется для интеграции с Gmail, Календарём Google и Google Tasks
Генерация ответа:
ИИ формирует интеллектуальные ответы на основе собранной информации, контекста текущей даты и истории переписки, а затем отправляет ответ пользователю через Telegram в формате Markdown.