нет смысла тренировать что-то своё на коленке, потому что это будет либо какой-то суперкастомный идиот, либо система, которая слишком много галлюцинирует (дуальная проблема увеличения шума против нерепрезентативности данных); а большую модель вы на коленке всё равно не натренируете.
поскольку проблема 1) - фундаментальная теоретическая проблема, коммерческие ЛЛМ идут по пути "пусть будет больше шума, всё равно первоначально у клиента будет «вау-эффект», и он купит подписку или кредиты. И вот тут самый цимес закрался. В отличие от человеческого интеллекта, возможности которого в отношение себя любимого мы может прогнозировать плюс-минус, не ошибаясь на порядки, в случае с ЛЛМ вы никогда не сможете оценить финансовые затраты на решение задачи. По моему опыту ЛЛМ лучше всего справляются с утилитами и гуишными тулзами строк на 3тыс кода, но не сильно больше. После определенного барьера, который можно условно измерить как количество строк в более или менее формализованном виде (в том, в котором сапиенсы пишут ТЗ для других сапиенсов), в промпты надо включать тупо всё ТЗ с самого начала.
Т.е. даже на платном антропике оно в какой-то момент начинает лажать и забывать изначальные вводные, которые были вот, совсем недавно, 10 промптов до того.
т.о., мы приходим к такому выводу, что промптинг нихрена не совместим с agile разработкой. Он создаёт видимость того, что в контексте есть данные, которые нам важны для дальнейших шагов, но это не так, потому что ЛЛМ не умеет интерпретировать токены, это тупая модель на больших данных, и соотв. давать ей задания лучше всего сразу готовые, в которых ещё за ручку надо объяснять, как что кодировать, иначе будет такая лапша, которую только эта модель ЛЛМ сможет дальше модифицировать, если не потеряет контекст мысли автора.
Т.е., по моему опыту, лажа начинается уже до 5к сток кода. И в определенный момент ты думаешь «слушай, спасибо, что ты типа нагуглил мне этот фреймворк, о котором я понятия не имел, что такое вообще есть, но дальше я сам буду читать мануалы, и буду кодировать сам, потому что тебе очень дорого всё разжёвывать, и эмоционально, и финансово».
llm, жж
| # | Наименование новости | Тональность | Информативность | Дата публикации |
|---|---|---|---|---|
| 1 | LLM (ИИ) - О СЕРЬЕЗНОМ И НЕМНОГО ЮМОРА, КАК ОБЫЧНО ... | 2 | 6 | 01-07-2026 |
| 2 | Воровство данных ллм-ками | -8 | 6 | 03-07-2026 |
| 3 | Я устал писать одноразовые скрипты для бенчмарков LLM и собрал харнесс, который сам считает Pareto-front | 0 | 7 | 27-06-2026 |
| 4 | Как желание быстрее читать чужой код превратилось в войну с недетерминизмом LLM | 0 | 5 | 28-06-2026 |
| 5 | Рекомендации по использованию AI при разработке открытого кода | 0 | 7 | 24-06-2026 |
| 6 | Как заставить LLM выбирать осмысленные фрагменты из часовой расшифровки: почему «найди интересные моменты» не работает | 0 | 5 | 28-06-2026 |
| 7 | ИИ'шка захавала документацию? | -6 | 3 | 30-06-2026 |
| 8 | Тестирую и убираю ботокосяки. Или почему я ненавижу помощника Яну. ... | -3 | 6 | 30-06-2026 |
| 9 | X. Главное происходит здесь. | 0 | 8 | 27-06-2026 |
| 10 | Один запрос прес лист, вот пример чека работы и отчетов ... | 5 | 7 | 29-06-2026 |