Просмотр новости

Найдите то, что Вас интересует

Нейронные аудиокодеки: мощное сжатие звука с помощью LLM

Дата публикации: 15-06-2026 07:01:12

В июле 2024 года французская компания Kyutai опубликовала речевую модель Moshi с нейронным аудиокодеком Mimi. Это был первый в мире голосовой end-to-end AI с открытыми исходниками, способный вести диалог в реальном времени и свободный для использования всеми желающими, демо.Вместо прямого предсказания сэмплов аудиокодек работает в три этапа:1. Токенизация звука. 2. Предсказание следующих токенов в LLM. 3. Восстановление оригинала. Читать далее

Классификация: Наука

Схожие новости

#Наименование новостиТональностьИнформативность
1Xiaomi представила ИИ-агента MiMo Code с открытым кодом00
2В Югре нейросеть научили озвучивать мансийские фразы00
3Vibecode по дешевке — домашний сервер с Qwen Code за 25к, который не отключит Anthropic00
4Claude Code убрал из моей работы рутину и почему я этому не долго радовался00
5Positive Technologies разработала своего первого ИИ-помощника00
6В МГУ разработали алгоритм для повышения точности нейросетей в роботах00
7Теперь в Алисе AI можно создать собственного ИИ-персонажа и общаться с ним00
8СМИ: супермодель ИИ от Anthropic смогла за часы взломать системы АНБ США00
9Модель поведения // Власти США впервые полностью запретили экспорт передовых ИИ-программ00
10让大模型从“一问一答”走向“边看边说”,京东开源实时视频视觉语言交互模型 JoyAI-VL-Interaction00

  • ТональностьТональность 0
  • ИнформативностьИнформативность 0
  • Источникhabr.com