Wetenschappers in Singapore hebben een nieuw kunstmatig intelligentiesysteem ontwikkeld dat anders denkt dan de meeste grote taalmodellen (LLM’s) zoals Chatgpt door veel betere prestaties te bereiken in veeleisende tests. Het nieuwe systeem, genaamd hiërarchisch redeneermodel (HRM), is geïnspireerd door de manier waarop het menselijk brein informatie op verschillende tijdschalen verwerkt. Met 27 miljoen parameters is het getraind in duizend monsters, in tegenstelling tot de miljarden of triljoenen parameters van de LLM’s van vandaag die ook worden getraind in een groot aantal monsters.
Volgens Sapient heeft HRM indrukwekkende resultaten behaald in de ARC-AGI-test, die wordt beschouwd als een van de moeilijkst om kunstmatige algemene intelligentiesystemen te evalueren. Het behaalde 40,3% succes in ARC-AGI-1, waarbij het modellen zoals Claude 3.7 (21,2%) van Antrhopic, Deepseek R1 (15,8%) van Deepseek en Openai’s O3-Mini-High (34,5%) overtrof. In de moeilijkste boog-Agi-2 bereikte het 5% en bleef het opnieuw voor op de concurrentie.
In tegenstelling tot Chain-of-Thought Redenering-gebaseerde LLM’s, gebruikt HRM een methode die het menselijk brein nabootst: een langzaam, abstract ontwerpniveau en een snel, gedetailleerd berekeningsniveau. Het maakt ook gebruik van de techniek van iteratieve verfijning door in elke “Burst of Thought” te beslissen of het zal doorgaan of een definitief antwoord zal geven.
Het model heeft bijna perfecte resultaten laten zien in complexe puzzels zoals Sudoku en het vinden van optimale routes op maze-taken, waarin conventionele LLM’s tekortschieten. Dit geeft aan dat HRM een veelbelovende benadering is voor kunstmatige intelligentie die verder gaat dan de bestaande grote taalmodellen. Het is een boeiende ontwikkeling die de potentie heeft om het veld van kunstmatige intelligentie te veranderen en nieuwe mogelijkheden te openen voor geavanceerde toepassingen in verschillende domeinen.