Нейронные аудиокодеки: мощное сжатие звука с помощью LLM

Дата публикации: 15-06-2026 07:01:12

В июле 2024 года французская компания Kyutai опубликовала речевую модель Moshi с нейронным аудиокодеком Mimi. Это был первый в мире голосовой end-to-end AI с открытыми исходниками, способный вести диалог в реальном времени и свободный для использования всеми желающими, демо.Вместо прямого предсказания сэмплов аудиокодек работает в три этапа:1. Токенизация звука. 2. Предсказание следующих токенов в LLM. 3. Восстановление оригинала. Читать далее

Классификация: Наука

Схожие новости

#	Наименование новости	Тональность	Информативность
1	Xiaomi представила ИИ-агента MiMo Code с открытым кодом	0	0
2	В Югре нейросеть научили озвучивать мансийские фразы	0	0
3	Vibecode по дешевке — домашний сервер с Qwen Code за 25к, который не отключит Anthropic	0	0
4	Claude Code убрал из моей работы рутину и почему я этому не долго радовался	0	0
5	Positive Technologies разработала своего первого ИИ-помощника	0	0
6	В МГУ разработали алгоритм для повышения точности нейросетей в роботах	0	0
7	Теперь в Алисе AI можно создать собственного ИИ-персонажа и общаться с ним	0	0
8	СМИ: супермодель ИИ от Anthropic смогла за часы взломать системы АНБ США	0	0
9	Модель поведения // Власти США впервые полностью запретили экспорт передовых ИИ-программ	0	0
10	让大模型从“一问一答”走向“边看边说”，京东开源实时视频视觉语言交互模型 JoyAI-VL-Interaction	0	0

Тональность 0
Информативность 0
habr.com

Просмотр новости

Найдите то, что Вас интересует

Нейронные аудиокодеки: мощное сжатие звука с помощью LLM

Дата публикации: 15-06-2026 07:01:12

Схожие новости