ChatGPT 4.1 este acum lansat și reprezintă un salt semnificativ față de GPT 4o, dar nu reușește să depășească benchmark-ul stabilit de Google Gemini.

Ieri, OpenAI a confirmat că dezvoltatorii cu acces la API pot încerca până la trei modele noi: GPT-4.1, GPT-4.1 mini și GPT-4.1 nano.

Conform benchmark-urilor, aceste modele sunt mult mai bune decât GPT-4o și GPT-4o mini existente, în special în ceea ce privește programarea.

De exemplu, GPT-4.1 obține un scor de 54.6% la SWE-bench Verified, ceea ce este mai bun decât GPT-4o cu 21.4% și cu 26.6% mai mare decât GPT-4.5. Avem rezultate similare și pe alte instrumente de benchmarking partajate de OpenAI, dar cum se compară cu modelele Gemini?

Conform benchmark-urilor partajate de Stagehand, un cadru de automatizare a browser-ului gata pentru producție, Gemini 2.0 Flash are cea mai mică rată de eroare (6.67%) împreună cu cel mai mare scor de potrivire exactă (90%), fiind și ieftin și rapid.

Pe de altă parte, GPT-4.1 are o rată de eroare mai mare (16.67%) și costă de peste 10 ori mai mult decât Gemini 2.0 Flash.

Alte variante GPT (cum ar fi „nano” sau „mini”) sunt mai ieftine sau mai rapide, dar nu la fel de precise ca GPT-4.1.

Într-o altă serie de date partajate de Pierre Bongrand, care este un cercetător care lucrează la ARN la Harward, GPT-4.1 oferă o mai slabă eficiență în raport cu costul decât modelele concurente.

Acesta este un factor important deoarece GPT-4.1 este mai ieftin decât ChatGPT 4o.

Modelele precum Gemini 2.0 Flash, Gemini 2.5 Pro și chiar DeepSeek sau o3 mini se apropie mai mult sau sunt chiar la frontiera, ceea ce sugerează că oferă o performanță mai ridicată la un cost mai mic sau comparabil.

În cele din urmă, deși GPT-4.1 încă funcționează ca o opțiune, este clar umbrit de alternative mai ieftine sau mai capabile.

Vedem rezultate similare în benchmark-urile de programare, cu Aider Polyglot listând GPT-4.1 cu un scor de 52%, în timp ce Gemini 2.5 este mult înainte cu 73%.

De asemenea, este important de menționat că GPT-4.1 este un model non-logic și rămâne unul dintre cele mai bune modele pentru programare.

GPT-4.1 este disponibil prin API, dar îl puteți folosi gratuit dacă vă înregistrați la Windsurf AI.

Lansarea iminentă a modelelor GPT-4.1, 4.1 nano și 4.1 mini de la OpenAI

OpenAI dorește ca ChatGPT să „vă cunoască pe parcursul vieții” cu noua actualizare de Memorie

OpenAI testează marcajele de apă pentru modelul de generare a imaginilor ChatGPT-4o

ChatGPT Plus de 20 de dolari de la OpenAI este acum gratuit pentru studenți până la sfârșitul lunii Mai

ChatGPT este în jos la nivel mondial cu eroare de ceva ce nu a mers bine

Compararea performanțelor între ChatGPT 4.1 și Google Gemini

Leave a Reply Cancel Reply