Skip to content

Commit bd76429

Browse files
committed
2025-05-22 15:59:51
1 parent 4c7745f commit bd76429

File tree

2 files changed

+42
-0
lines changed

2 files changed

+42
-0
lines changed

eng_2025/05/2025-05-22-15-20.md

Lines changed: 21 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,21 @@
1+
I remember back in the GPT-4 era, many custom models appeared, specifically "tuned" for programming. There were even separate models for Python. Phind.com was doing cool stuff. Then it all somehow subsided, and most universal models became good at writing code anyway.
2+
3+
https://windsurf.com/blog/windsurf-wave-9-swe-1
4+
Windsurf recently released their **SWE-1** models, but I think this is more of a step to reduce external API costs.
5+
6+
The Mistral company still provides API access to the closed **Codestral** model, last updated January 2025.
7+
8+
---
9+
10+
And here we have a new turn, now models are being configured for background **independent coding of a range of tasks** from a git repository. OpenAI has just re-released `Codex`, now based on `o3`. Github has updated its agent, adding a background work function.
11+
12+
https://mistral.ai/news/devstral
13+
Mistral's answer is the **Devstral model**, developed jointly with [All-hands](https://www.all-hands.dev/) (an open-source clone of the AI developer Devin). Unlike Codestral, the license here is Apache 2.0, meaning free use and modification. The model is also available via API under the name `devstral-small-2505`.
14+
15+
What the model does better:
16+
- Parses large repositories
17+
- Finds connections between components
18+
- Scans code for errors
19+
- Is trained to solve real problems from GitHub
20+
21+
According to All Hands AI 🙌, Devstral outperforms significantly larger models such as `Deepseek-V3-0324 (671B)` and `Qwen3 232B-A22B`. At the same time, Devstral is light enough to **run on a single RTX 4090** or a Mac with 32 GB of RAM, making it an ideal choice for background local use.

ukr_2025/05/2025-05-22-15-20.md

Lines changed: 21 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,21 @@
1+
Пам'ятаю, за часів GPT-4 з'являлися багато кастомних моделей, спеціально "заточених" під програмування. Були навіть окремі моделі під Python. phind.com робив круті штуки. Далі це все якось стихло, більшість універсальних моделей і так стали добре писати код.
2+
3+
https://windsurf.com/blog/windsurf-wave-9-swe-1
4+
Windsurf нещодавно випустили свої моделі **SWE-1**, але я думаю це скоріше крок щоб скоротити витрати на зовнішні API.
5+
6+
Компанія Mistral досі надає API доступ до закритої моделі **Codestral**, останнє оновлення січень 2025.
7+
8+
---
9+
10+
І ось у нас новий виток, тепер моделі налаштовують на фонове **самостійне вирішення низки завдань** з git-репозиторію. OpenAI тільки но перевипустили Codex, тепер заснувавши модель на o3. Github оновили агента, додавши функцію фонової роботи.
11+
12+
https://mistral.ai/news/devstral
13+
Відповідь від Mistral — це **модель Devstral**, розроблена спільно з [All-hands](https://www.all-hands.dev/) (опен-сорс клон ШІ розробника Devin). На відміну від Codestral ліцензія тут Apache 2.0, тобто вільне використання та модефікація. Модель також доступна через API під назвою `devstral-small-2505`.
14+
15+
Що краще робить модель:
16+
- розбирає велики репозиторії
17+
- знаходить зв'язки між компонентами
18+
- сканує код на помилки
19+
- Модель навчена розв'язувати реальні проблеми з GitHub
20+
21+
За даними All Hands AI 🙌Devstral перевершує значно більші моделі, такі як Deepseek-V3-0324 (671B) та Qwen3 232B-A22B. При цьому Devstral достатньо легка, щоб **працювати на одній RTX 4090** або Mac з 32 ГБ оперативної пам'яті, що робить її ідеальним вибором для фоновго локального використання.

0 commit comments

Comments
 (0)