Путь от одной A100 в облаке до кластера на H200 — это не просто апгрейд железа, а история о том, как ML-команда перестала искать «ту самую идеальную модель» и начала строить экосистему. Когда под капотом миллионы строк C-кода PostgreSQL, а задачи варьируются от генерации hint-сетов до Graph-RAG, модель превращается из «черного ящика» в обычный заменяемый компонент. Рассказываем, как мы пересобрали стек на базе vLLM и MCP, почему контекст-менеджмент важнее весов модели и как заставить 0.6B-параметров работать не хуже гигантов через GRPO. Читать далее
| # | Наименование новости | Тональность | Информативность | Дата публикации |
|---|---|---|---|---|
| 1 | Промпты, RAG, LLM-тюнинг, Harness… Идём дальше? | 0 | 7 | 11-06-2026 |
| 2 | Postgresso #3 (88) | 0 | 7 | 03-05-2026 |
| 3 | [Перевод] Как оптимизировать LLM-инференс в 2026 году | 0 | 0 | 22-06-2026 |
| 4 | Каким будет энтерпрайз-СУБД в эпоху ИИ | 0 | 5 | 06-01-2026 |
| 5 | В погоне за APDEX-ом, или как создать HighLoad на недорогом серверном железе | 5 | 7 | 20-05-2026 |
| 6 | Рег.облако запускает собственную ИИ-платформу для массовой аудитории | 0 | 0 | 17-04-2026 |
| 7 | Я не хотел писать ORM для Kotlin/Native. Мне просто нужен был PostgreSQL | 0 | 0 | 22-06-2026 |
| 8 | VSA, которого не было: первый reasoner на 16 КБ без LLM | 0 | 0 | 22-06-2026 |
| 9 | Как устроены рекомендации с LLM: холодный старт, RAG и zero-shot ранжирование | 0 | 0 | 08-06-2026 |
| 10 | Харды не спасут: почему «человек-клей» выживет, а «токсичного гения» уволят (даже если он тащит прод) | 0 | 5 | 12-12-2025 |