İlk dəfə olaraq, Web3 süni intellektinin etalon testi 31 aparıcı modeli — o cümlədən GPT-5 , Claude və Gemini -ni — 3,543 ekspert sualı üzrə sınaqdan keçirdi. Nəticə: heç bir sistem sahənin ən yüksək riskli tapşırıqları üçün hazır deyil. SİNQAPUR , 31 may 2026 /PRNewswire/ -- Tibbi süni intellektin MedQA -sı var. Maliyyə süni intellektinin FinBen -i var. Hüquqi süni intellektin LegalBench -i var. Mövcud olan ən rəqabətli, maliyyə cəhətdən əhəmiyyətli proqram mühitlərindən biri olan Web3 -ün heç nəyi yox idi. Bu gün bu dəyişir. Enhao Huang — Ph.D. Namizəd, Zhejiang Universiteti nin Milli Blokçeyn və Məlumat Təhlükəsizliyi Açar Laboratoriyası; Aparıcı Tədqiqatçı, DMind Benchmark . Foto: DMind AI DMind AI , Zhejiang Universiteti və Nanyang Texnoloji Universiteti (NTU) tədqiqatçıları ilə əməkdaşlıq edərək, “DMind Benchmark: Web3 Domenində LLM İmkanlarının Holistik Qiymətləndirilməsinə Doğru” adlı tədqiqat işinin KDD 2026 — ACM SIGKDD Bilik Kəşfi və Məlumat Mədənçiliyi Konfransı nda qəbul edildiyini elan edir. Bu konfrans süni intellekt və məlumat elmi tədqiqatları üçün dünyanın ən nüfuzlu məkanı hesab olunur. Məqalə 9-13 avqust 2026-cı il tarixlərində Koreya nın Jeju şəhərində təqdim olunacaq. Nəticə: 31 Model Sınaqdan Keçirildi. Heç biri Web3 üçün hazır deyil. DMind Benchmark dünyanın aparıcı 31 süni intellekt sistemini — o cümlədən GPT-5 , Claude , Gemini , DeepSeek və Qwen -i qiymətləndirdi. Nəticələr bu gün Web3 -də süni intellekt tətbiq edən hər hansı bir təşkilat üçün açıq bir xəbərdarlıqdır: Təhlükəsizlik baxımından kritik domenlər süni intellektin ən çox uğursuzluğa düçar olduğu yerlərdir. Təhlükəsizlik zəifliklərinin aşkarlanması və token iqtisadiyyatı mühakiməsində performans çöker — məhz burada süni intellektin uğursuzluğu geri dönməz maliyyə itkisinə çevrilir. Təhlükəsizlik zəifliklərinin aşkarlanması və iqtisadi mühakimədə performans çöker — məhz burada süni intellektin uğursuzluğu geri dönməz maliyyə itkisinə çevrilir. Heç bir model istehsal üçün hazır deyil. Hətta ən yaxşı performans göstərən sistemlər belə, real Web3 auditi və ya idarəetmə kontekstində qəbuledilməz olan imkan boşluqlarını ortaya qoyur. Hətta ən yaxşı performans göstərən sistemlər belə, real Web3 auditi və ya idarəetmə kontekstində qəbuledilməz olan imkan boşluqlarını ortaya qoyur. Mühakiməni saxtalaşdırmaq olmaz. Tam etalon üzərində rəqabətli incə tənzimləmə bir nöqtədən az qazanc gətirdi — bu da həqiqi çoxmərhələli mühakimənin yaddaşla əvəz oluna bilməyəcəyini təsdiqləyir. Tam etalon üzərində rəqabətli incə tənzimləmə bir nöqtədən az qazanc gətirdi — bu da həqiqi çoxmərhələli mühakimənin yaddaşla əvəz oluna bilməyəcəyini təsdiqləyir. Praktik bir irəliləyiş yolu mövcuddur. Pareto səmərəlilik analizi bu gün süni intellekti Web3 iş axınlarına inteqrasiya edən təşkilatlar üçün ən yaxşı performans-xərc nisbətini təklif edən modelləri müəyyən edir. “Nəticə aydındır: bugünkü süni intellekt modelləri hələ Web3 -ün ən kritik iş axınlarında nəzarətsiz tətbiq üçün təhlükəsiz deyil. DMind Benchmark sənayenin əskik olan diaqnostik vasitəsidir — və indi, ilk dəfə olaraq, biz boşluğu ölçə və bağlaya bilərik.” — DMind AI Tədqiqat Komandası Niyə Bu Vacibdir: Bağışlamayan Bir Mühitdə Milyardlarla Dollar Risk Altında Web3 digər proqram domenlərinə bənzəmir. Ağıllı müqavilələr tətbiq edildikdən sonra dəyişməzdir. DeFi protokolları milyardlarla dollar real aktivləri idarə edir. Tək bir zəiflik fəlakətli, geri dönməz maliyyə itkisinə səbəb ola bilər — və dəfələrlə səbəb olmuşdur. Bu mühitdə etibarsız süni intellektin tətbiqi nəzəri bir risk deyil: bu, məhv edilmiş kapital, çökmüş protokollar və sarsılmış istifadəçi etibarı ilə ölçülür. Lakin indiyə qədər süni intellekt sənayesinin fundamental bir suala cavab vermək üçün etibarlı bir yolu yox idi: mövcud böyük dil modellərinə Web3 iş axınlarında həqiqətən etibar etmək olarmı? “ Web3 kiçik bir mühakimə səhvinin istismar edilə bilən bir müqaviləyə və ya uğursuz bir protokola çevrilə biləcəyi rəqabətli, yüksək riskli bir mühitdir. Biz DMind Benchmark -ı qurduq, çünki sahəyə ciddi, domenə əsaslanan bir standart lazım idi — sadəcə ümumi bilik testi deyil.” — DMind AI Tədqiqat Komandası DMind Benchmark haqqında: Real Web3 Dünyası üçün Qurulmuşdur DMind Benchmark doqquz əsas Web3 domenini — o cümlədən Ağıllı Müqavilələr , DeFi , Təhlükəsizlik Zəiflikləri , Token İqtisadiyyatı və DAO -ları əhatə edən 3,543 ekspert tərəfindən hazırlanmış sualdan ibarətdir. Hər biri səkkiz ildən çox cəbhə xətti blokçeyn təcrübəsinə malik beş domen mütəxəssisi tərəfindən qurulmuşdur, 39 nüfuzlu mənbədən 6.1 GB məlumatın mənşəyi izlənilən korpusundan istifadə edir. Onun çirklənməyə qarşı dizaynı modellərin cavabları əzbərləyərək hiyləgərlik edə bilməyəcəyini təmin edir. Rəqabətli incə tənzimləmə təcrübələri yalnız həqiqi domen mühakiməsinin — əzbər yaddaşın deyil — yüksək nəticələr verdiyini təsdiqləyir. Akademik Təsdiq və Sübut Edilmiş Çəki KDD 2026 qəbulu DMind Benchmark -ı rəsmi olaraq tanınmış elmi standarta — Web3 -də süni intellekti qiymətləndirən, inkişaf etdirən və ya tətbiq edən hər hansı bir təşkilat üçün qəti istinad nöqtəsinə yüksəldir. 2025-ci ilin aprelində Hugging Face -də açıq mənbəli buraxılışından bəri, etalon demək olar ki, tam bir həftə ərzində Hugging Face -də #1 trend mövqeyinə çatdı və 2026-cı ilin yanvarına qədər 9,650-dən çox yüklənmə topladı. “ KDD qəbulu bu işə Web3 AI sahəsində əskik olan akademik təsdiq səviyyəsini verir. Ən yaxşı süni intellekt və məlumat elmi məkanında qəbul edilmiş ilk peer-reviewed Web3 AI etalonlarından biri olaraq, DMind Benchmark söhbəti səs-küydən kənar, ölçülə bilən imkan, təhlükəsizlik və etibara doğru aparmağa kömək edir. Bu, süni intellekt sistemlərinin yüksək riskli mərkəzləşdirilməmiş mühitlər üçün həqiqətən hazır olub-olmadığını qiymətləndirmək üçün ciddi bir təməl yaradır.” — Prof. Feida Zhu , Tərəfdaşlıq və Əlaqələr üzrə Assosiasiya Dekanı, Hesablama və İnformasiya Sistemləri Məktəbi, Sinqapur İdarəetmə Universiteti Məlumat dəsti və tam qiymətləndirmə vasitəsi ictimaiyyətə açıqdır: https://huggingface.co/datasets/DMindAI/DMind_Benchmark Tədqiqat Diqqət Mərkəzində: Əsas Müəlliflə Tanış Olun Enhao Huang 2022-ci ildə Zhejiang Universiteti ndə İnformasiya Təhlükəsizliyi üzrə bakalavr tələbəsi və Milli Blokçeyn və Məlumat Təhlükəsizliyi Açar Laboratoriyasında birbaşa daxil olan doktorant namizədidir. Onun tədqiqatları böyük dil modellərinin və intellektual agentlərin təhlükəsizliyinə yönəlmişdir. Erkən karyera nailiyyətləri ilə seçilən bir tədqiqatçı olan Huang : Çin Milli Təbiət Elmləri Fondu Gənc Tələbə Xüsusi Proqramı tərəfindən maliyyələşdirilən bir layihəyə rəhbərlik etmişdir KDD , WWW , S&P və ICLR daxil olmaqla aparıcı məkanlarda 10 məqalə dərc etmiş və ya qəbul etdirmişdir NeurIPS , ACL , ICML və digər aparıcı konfranslar üçün dəvətli rəyçi kimi xidmət etmişdir 8 verilmiş və ya dərc edilmiş ixtira patentinin əsas ixtiraçısı kimi adlandırılmışdır Onun DMind Benchmark -a verdiyi töhfələr əməkdaşlığın süni intellekt təhlükəsizliyi tədqiqatını dünya səviyyəli akademik ciddiliyə əsaslandırma öhdəliyini əks etdirir. Tədqiqat və Reallıq Arasında Körpü: DMind AI və Minara DMind Benchmark -ın arxasında duran eyni inam — Web3 -ün ən yüksək standartlara cavab verən süni intellektə layiq olması — DMind AI və Minara arasında strateji tərəfdaşlığı idarə edir. Minara , Web3 istifadəçiləri üçün xüsusi olaraq qurulmuş bir süni intellekt köməkçisidir. Ümumi təyinatlı süni intellekt köməkçiləri ağıllı müqavilələri etibarlı şəkildə audit etmək, DeFi protokol mexanizmlərini idarə etmək və ya idarəetmə təkliflərini qiymətləndirmək üçün domen dərinliyinə malik deyillər. DMind -in tədqiqatının aydın şəkildə göstərdiyi kimi, nəticələr sadəcə suboptimal çıxışlar deyil — onlar həqiqi təhlükəsizlik riskləridir. Birlikdə, DMind AI və Minara ciddi akademik nəticələri Web3 tərtibatçılarının, təhlükəsizlik auditorlarının, DeFi treyderlərinin, protokol komandalarının və gündəlik istifadəçilərin bu gün etibar edə biləcəyi real dünya alətlərinə çevirmək üçün çalışırlar. Etalon standartı müəyyən etdiyi yerdə, tərəfdaşlıq ona cavab vermək — və barı davamlı olaraq yüksəltmək üçün çalışır. DMind AI haqqında DMind AI , Web3 ekosistemi üçün təhlükəsiz, etibarlı və domenə ixtisaslaşmış süni intellekt qurmağa həsr olunmuş Sinqapur mərkəzli bir süni intellekt şirkətidir. Böyük dil modelləri, blokçeyn texnologiyası və kriptoekonomik mühakimənin kəsişməsində, DMind AI -nin missiyası süni intellekti dünyanın ən yüksək riskli mərkəzləşdirilməmiş mühitlərində kifayət qədər etibarlı etməkdir. Media Əlaqə DMind AI | Sinqapur Vebsayt: https://dmind.ai DMind Benchmark məqaləsi DMind AI , Zhejiang Universiteti və Nanyang Texnoloji Universiteti tədqiqatçıları tərəfindən birgə yazılmışdır. Müəlliflərin tam siyahısı və məqalənin detalları KDD 2026 materiallarında dərc olunacaq. MƏNBƏ DMind AI