AMI Rezidenturası Hissəsi 1: Səs-küyün mənasını proqnozlaşdıran (kəşf edən) məkan araşdırmaq, insan qərəzinə qarşı öyrənildi.

Qadınlarda vaginalar var, kişilərdə burun boşluğu var

Bu, son illər ərzində apardığım tədqiqatlarla bağlı yazdığım bir sıra məqalələrin ikincisidir [1, 2, 3]. May / İyun 2016-da Google’un Rəssamlar və Maşın İntellektual proqramında rezident idim. Ayrı-ayrı nəticələrlə bir neçə əlaqəli mövzunu araşdırdım. Buna görə iki yazıda bu barədə yazacam. Bu, birincisidir.

Bu yazı ilə əlaqəli bağlantılar: - @wordofmath, @wordofmathbias, @almost_inspire - Piton və OF / C ++ src-də https://github.com/memo/ofxMSAWord2Vec - (bu yazı ilə əlaqəli heç bir kağız yoxdur)

Giriş

Gizli məkanı araşdırmaq çox maraqlı bir şey ola bilər. Daha əvvəl burada bu barədə dərin yazdım. Çox uzun bir hekayəni qısa bir şəkildə kəsmək üçün gizli bir məkan, bir nöqtənin bir nümunə və ya bir nümunəni təmsil etdiyi yüksək ölçülü bir məkan kimi düşünülə bilər. Ən əsası, bu gizli məkanı belə ideal şəkildə bir mənalı, semantik münasibətləri özündə cəmləşdirən şəkildə qurmağa cəhd edə bilərik, məsələn, onları dəyişdirmək üçün nöqtələrdə həndəsi əməliyyatlar edə bilərik və ya məlumatları mənalı şəkildə idarə etmək üçün müəyyən istiqamətlərdə hərəkət edə bilərik bir eynək əlavə etmək və ya üz təbəssümü etmək və s.

Maşın Öyrənməsinin (ML) bəzi aspektlərini giriş və çıxış sahələrimizdən (məsələn, xam piksel) belə gizli fəzalara aparan öyrənmə funksiyaları kimi düşünmək olar. Dərin bir sinir şəbəkəsi vasitəsi ilə məlumatların boru kosmosdakı (və zamanla) çox ölçülü və dönüşümlü bir səyahət kimi düşünülə bilər.

Söz əlavə etmə

Söz qoşmaları (və ya söz vektorları) sözlərə tətbiq olunan oxşar anlayışdır. Bir dilin lüğət ehtiyatını götürmək olar (məsələn, 20,000 söz, 50.000 söz, 100.000 söz və s.) Və onları ixtiyari yüksək ölçülü məkanda nöqtə kimi istifadə edə bilərsiniz.

Bunu edən bir neçə qurulmuş alqoritm var, xüsusən də Word2Vec və GloVE bunu çox yaxşı bacarır. Bunlar nəhəng bir mətn korpusundan (məsələn, 100 milyard söz) keçən alqoritmlərdir və sözlər arasında mürəkkəb, mənalı, fəza əlaqələrinin olması üçün sözləri yüksək ölçülü məkanda (məsələn, 300D) necə yerləşdirməyi öyrənirlər. Yalnız məna ilə əlaqəli olan sözlərin bir-birinə yaxın olması deyil, həm də onların təşkil edilən istiqamətləri və məsafələri bir şey deməkdir.

Mikolov, T., Corrado, G., Chen, K., & Dean, J. (2013). Vektor məkanında Word nümayəndəliklərinin səmərəli qiymətləndirilməsi. Öyrənmə Nümayəndəlikləri üzrə Beynəlxalq Konfransın materialları (ICLR 2013)

Və beləliklə məşhur şəkildə riyaziyyat əməliyyatları edə bilərik. Sol görüntüdə 'kral' sözündən 'kraliçaya' qədər olan vektorun 'kişidən' 'qadına' vektora çox bənzədiyini görə bilərsiniz (Bu, orijinal 300D gizli məkandan 3D, vizual məqsədlər üçün 2D-ə qədər). Və ya əslində 'kişidən' 'krala' vektor 'qadından' 'kraliçaya' qədər olan vektora çox oxşardır. Beləliklə, vektoru həqiqətən 'kişi' dən 'king' (yəni 'king' - 'man') vektoruna 'qadın' üçün vektor əlavə edə bilərik və bu 300D gizli məkanda yeni bir nöqtə ilə sona çatırıq. Bu nöqtəyə ən yaxın sözü axtarsaq, bunun 'kraliça' olduğunu görərik (əslində bu tamamilə doğru deyil, daha sonra bu).

Söz analoqları

Bunu məşhur word2vec nümunəsi kimi yaza bilərik: king - man + qadın => kraliça

Bu, bir söz analoqu kimi də tanınır və tez-tez sintaksislə yazılır: kişi: king :: qadın: [kraliça] (oxu: "kişi qadına olduğu kimi padşahdır?" Və model 'kraliçanı' qaytarır)

Eynilə, "gəzmək" dən "gəzmək" ə vektor "üzmə" dən "üzmək" ə vektora çox bənzəyir. Model gərginliyi də öyrənir. Həm də ölkə-kapital əlaqələri, məsələn 'İspaniya' dan 'Madrid' və 'İtaliya' 'Roma' və s. İstiqamətlərini müqayisə edin.

Ən əsası, bu münasibətlər insanlar tərəfindən təlim zamanı açıq şəkildə tətbiq edilmir. Təlim korpusundan nəzarətsiz bir şəkildə öyrənilirlər. Öyrənmə alqoritmi mətni təkrarlayır və sözlərin cümlələr və ifadələr şəklində necə qurulduğunu və vektorların necə təyin olunacağını izah edir.

Yuxarıdakı diaqramların 3D məkanına (2D məkana proyeksiya edilmiş) proqnozlar olduğunu unutmayın ki, onları görə bilək. Əslində bu gizli boşluq 300D-dir, buna görə də təsəvvür etməyə başlamadığımız istiqamətlərdə daha çox əlaqəni ələ keçirir. Kim daha nəyi öyrəndiyini bilir.

Beləliklə, bu məkanı araşdırmaq üçün bir neçə twitter bot yazdım.

@WordOfMath

Bu bot təsadüfi sözlər üzərində təsadüfi riyazi əməliyyatlar aparır və nəticələrini tvit edir.

Əvvəlcə 100K sözlü bir lüğətdən 2 ilə 4 arasında tamamilə təsadüfi sözlər seçir (əslində bu 53K sözlər, mənbədə izah olunan səbəblər. Qeyd edək ki, təhsilli doğma İngilis dillərində təxminən 20K-30K sözlərin olduğu bir lüğət var). Bot bu sözləri yüksək ölçülü gizli bir məkanda yerləşdirir (100 milyard Google xəbərində Mikolov et al tərəfindən hazırlanmış məşhur word2vec modelindən istifadə edərək). Daha sonra bu vektorlarda təsadüfi arifmetik əməliyyatlar (əlavə və ya toplama işlənməsi) həyata keçirir. Bu, yüksək ölçülü məkanda yeni bir yer açması ilə nəticələnir. Bot sonra ən yaxın sözləri qaytarır.

https://twitter.com/wordofmath

Yəni 'insan' - 'tanrı' = 'heyvan', botun təsadüfi olaraq 'insan' və 'tanrı' sözlərini seçdiyini və təsadüfi bir toplama işləməyi qərara aldığını göstərir. Bu "insan" üçün vektordan "tanrı" vektorunu ayırır və bu nöqtəyə ən yaxın sözü tapır və tvit edir, bu vəziyyətdə "heyvan" (əslində ən yaxşı beş ən yaxın sözləri tweets edir, burada yalnız bir neçə əllə seçdim) ən çox sevdiyim nəticələr).

Yuxarıda bəzi tam orijinal, təcrübəsiz nəticələr görə bilərsiniz. Ancaq yüzlərlə (minlərlə olmasa?) Nəticələr olduğunu qeyd etməliyəm və ən çox sevdiyim bir neçə albalı seçdim. (Əslində hamısını yaxşıca nəzərdən keçirməmişəm, daha maraqlıları da ola bilər).

Əvvəlcə mən nəticələr daha "həssas" və maraqlı görünməsi üçün botun seçilməli olduğu sözlərə qaydalar tətbiq etməyə çalışırdım. Ancaq bunu edərkən, botun daha çox "yaradıcı" (və daha maraqlı və ya gözlənilməz) nəticələr tapmaq imkanını məhdudlaşdırdığımı başa düşdüm. Beləliklə, tətbiq etdiyim hər hansı bir məhdudiyyəti aradan qaldırdım və botun boşluğu daha sərbəst araşdırmasına imkan verdim. İndi çox mənasız, bəzən mənasını vermək çox çətin olan nəticələr verir.

Və əslində bu layihənin sona çatması budur.

Modelin bizə söylədiyi şey deyil, nəticədə nə axtardığımız və görəcəyimiz deyil.

Tüber nümunələri twitter-də tapıla bilər. Aşağıda seçdiyim bir neçə. İlk bir neçə nümunəni şərh etmək olduqca asandır.

insan - tanrı = heyvan

Bu maraqlıdır. Bunu belə izah etmək olar: "əgər tanrıya inanmırıqsa, ibtidai heyvanlar səviyyəsinə enəcəyik" və ya alternativ olaraq: "insanları digər heyvanlardan fərqləndirən şey, tanrı obrazında yaradıldığımızdır. ”. Və ya ola bilər: "insanlar din və tanrı inanclarını icad etmiş heyvanlardır" və s.

Bunu şərh etməyin yəqin ki, bir çox yolu var və mən başqa fikirləri eşitmək istərdim. Ancaq həqiqət budur ki, bunun hər hansı bir mənasını verdiyini düşünmürəm. Çünki bunun arxasında heç kim yoxdur, onu demək, hər hansı bir məna vermək. Bu sadəcə səs-küydür, filtrlə formalaşır və sonra istədiyimizi düzəldirik. Şüurlu və ya şüursuz bir şəkildə istədiyimizi formalaşdırmaq üçün sadəcə başlanğıc nöqtəsidir.

Bəziləri razılaşmaya bilər və modelin öyrətdiyi kütləvi mətn corpusundan öyrəndiyini və modelin hazırladığı bu əsərin korpusa daxil edilmiş mənaları daşıydığını söyləyə bilər. Bu, əlbəttə ki, müəyyən dərəcədə doğrudur və əvvəllər verilən misallarla təsdiqlənə bilər, məsələn, kral-kişi + qadın = kraliça və ya gəzinti-gəzmək + üzmək = üzmə. Şübhəsiz ki, modelin bu hallarda belə mənalı nəticələr verməsi təsadüf deyil?

Modelin bir şey öyrəndiyi kimi görünür. Ancaq modelin sərhədlərini itələməyə başladığımız zaman, beynimizin şəkil qalan hissəsini tamamlayaraq "yarı təsadüfi" nəticələr ola biləcəyini qarşıya qoyduğu modelə dair nə öyrəndiyinə dair nəticə çıxarmaq cazibəsinə qarşı çıxsaq yaxşı olar. . Modelin mənalı olmağı dayandırdıqda və təsadüfi nəticələr yaratmağa başladığı zaman kəsilmə nöqtəsinin olmasını təklif etmirəm. Daha çox spektrdir. Modelin "rahat" olması ilə nə qədər uzaqlaşsaq (yəni məşq zamanı bolluğu görmüş, öyrənmiş və ümumiləşdirməyi bacaran), səs-küyün çıxışda nə qədər əhəmiyyətli olması (yəni səs-küydən aşağı səs nisbəti) və qərəzli şərhlərimiz üçün potensial olaraq daha məhsuldar bir nəticə çıxara bilər.

Bu barədə bir az sonra daha geniş məlumat verəcəyəm. Ancaq əvvəlcə daha bir neçə nümunə.

təbiət - tanrı = dinamika

Xüsusilə bu xoşuma gəlir. Mən bunu "tanrıya ehtiyac olmadan, təbiət yalnız fizikanın qanunları" kimi şərh edirəm.

twitter + bot = memes

Bunu görəndə buna inana bilmədim. Demək olar ki, heç bir izaha ehtiyac yoxdur. "Twitterdəki botlar memes halına gəlir". Doğru olmaq çox yaxşıdır.

seks - sevgi = yaxınlıq, mastürbasyon, fahişəlik, təcavüz

Bu güclüdür. Mən bunu "Sevgisiz cinsiyyət yalnız münasibətdir" və ya "fahişəlik, sevgisiz cinsiyyət" və ya "təcavüz cinsi və nifrət (sevginin tərsi kimi)" kimi şərh edirəm. Bu nəticələr çox maraqlıdır. Yenə də, modelin bu təfsiri təlim məlumatlarından öyrəndiyini qəbul etmək lazım deyil. Çox güman ki, bu sözlərin hamısı bir-biri ilə əlaqəli sözlər olduğu üçün 'seks' və / və ya 'sevgi' yaxınlığında bir yerdədir. Bəli, bəlkə də bu sözlər 'eşq' və ya 'cins' 'müəyyən bir istiqamətdə yalan danışır. Kosmosda ortaya qoyulan bir dəstə sözlə "sevgisiz cinsi yaxınlıq və ya fahişəlik ..." cümləsi arasında fərq var. Sonuncu, məkan düzenini şərhimdir.

səlahiyyətlilər - fəlsəfə = polis, hökumətlər

Yaradıcılığımı bu mənada anlaya bilmək üçün məcbur etməliyəm. Mən özümdən soruşuram: “Fəlsəfəni düşünmə, məntiqli və tənqidi düşünmə aktı olaraq düşünsək; o zaman bəlkə də bu cümlə deyirlər ki, polis və hökumətlər düşünməyən və məntiqli olmayan bir hakimiyyətdir? ”. Və ya başqa sözlə “hansı hakimiyyət orqanlarında tənqidi düşüncə yoxdur? Polis və hökumətlər ”.

saqqal - əsaslandırılmış - məkan + doktrina = ilahiyyat, və'z

Bu, yaradıcılığımın sərhədlərini daha da artırır. Ancaq çox cəhd etsəm mənasını tapa bilərəm. Məsələn, saqqalın ənənəvi və stereo adətən hikməti ifadə etdiyini fərz edək. Bir saqqal düşünün, bu haqlı deyil - yəni müdrikliyi ifadə edir, amma əslində belə deyil. Əslində, bu xüsusi saqqal məkanı (mən "kainat", "bilik", "elm" kimi təmsil edəcəyimi güman etdiyim) doktrina ilə əvəz edir. Müdrik kimi görünən, ancaq elmini doktrina ilə əvəz edən belə saqqalı haradan tapa bilərik? Əlbətdə ilahiyyatda, məsələn, bir təbliğçi.

Əlbətdə bu, bir kvadrat çuxuru yuvarlaq bir çuxura sığdırmaq üçün çox çətinlik çəkirəm, bu modelin yaydığı bu 'yarı təsadüfi' cümləsini anlamağa çalışıram. Kimsə bu cümləni mənim təfsir etməyi seçdiyimin tam əksini ifadə edə bilsə təəccüblənməzdim.

Layihə səs-küyün üzərinə

Buna baxmayaraq, bu nəticələr sonsuz dərəcədə maraqlıdır. Modelin ingilis dilini bu qədər güclü bir anlayışa sahib olduğunu düşünməyim üçün deyil, bir növ 'məna filtri' rolunu oynadığı üçün.

Modelə daxil olan şey tamamilə təsadüfi (yəni bot seçdiyi sözlər və arifmetik əməliyyatlar). Və ya dilimlə bir az daha dəqiq olmaq üçün, vahid paylama, ağ səs-küy ilə səs-küy kimi düşün.

Yəqin ki, burada əhval-ruhiyyə yazmağınız üçün çox material yoxdur? Çox boş bir şiferdir.

Model sonra səs-küyə effektiv bir filtr tətbiq edir, onu bükür, formalaşdırır və səs-küyün yeni bir növü çıxır.

https://en.wikipedia.org/wiki/Fayl :Rorschach_blot_01.jpg

Daha ümumi mənada, bu gizli boşluqları fərqli sahələr üçün, məsələn, sözlər, şəkillər, səslər, mətn və s. Üçün Rorschach tipli mürəkkəb lövhələrin qurulma yolları olaraq görürəm. Təsadüfi ədədlər və ya proseslər (yəni ağ səs-küy) modelə daxil olur və daha çox 'strukturlaşdırılmışdır təsadüfi 'nəticələr çıxır. Hələ 'təsadüfi', lakin daha dəqiq bir paylanması, daha çox quruluşu ilə. Hər şeyi görə biləcəyimiz və layihə mənasını verən bir quruluşa sahib olacağıq.

Biz quruluşu istəyən maşınlarıq və onlar üçün məna daşıyırıq. Çünki etdiyimiz budur. Həmişə etdiyimiz şeydir. Təbiətdə necə yaşamağımız, bir-birimizlə necə əlaqə qurmağımızdır. Biz hekayələr icad edirik, materiallar hazırlayırıq və onlara inanırıq. Qanunvericilik axtarırıq və kim olduğumuzu və bildiklərimizə əsaslanaraq onlara məna veririk.

Gördüyümüz, oxuduğumuz və ya eşitdiyimiz hər şey, bu anda yazdığım bu cümlələr, keçmiş inanclarınız və biliklərinizlə süzülən keçmiş keçmişlərinizlə əlaqəli məna verməyə çalışırsınız.

Bəzən - bu səhifədəki bu sözlərdəki kimi - artifaktın içərisində nəzərdə tutulmuş bir məna var. Bu, mənim kimi bir əsərin istehsalçısı - ortaq bir dil, ünsiyyət metodu və kontekstdən (məsələn, Latın əlifbası, İngilis dili və s.) İstifadə edərək mənimsənilmiş bir məna. Bu vəziyyətdə inşallah mənasını mən nəzərdə tutduğum kimi şərh edəcəksiniz. Bunu başlanğıc nöqtəsi kimi istifadə edəcəksiniz, sonra özünüzdə olduğunuz inanclarla birləşdirdiyiniz təqdirdə, ümid etdiyim mənaya bir qədər uyğun gələn bir mesajı götürəcəksiniz. Əlbətdə bəlkə də yox, qeyri-müəyyən ünsiyyət səbəbindən fikir ayrılıqlarına girmək çox asandır. Yalnız Richard Dawkins-dən soruşun.

Ancaq yenə də həmişə nəzərdə tutulan, daxil edilmiş bir məna olmayan və ya əslində başlayacağı müəllifin olmadığı yerlərdə məna tapa bilirik. Buludlarda üzü görəndə və ya tostda olan müqəddəs insanlar kimi. Və ya hətta gecə səmasını bəzəyən parlaq nöqtələrə baxaraq dünyanın fərqli mədəniyyətlərinin icad etdiyi çoxsaylı mif və hekayələr kimi.

Babak Tafreshi (TWAN) tərəfindən

Keçən il ilk dəfə çıxanda Deepdream haqqında ən sevdiyim budur. Trippy bala-slugs və quş-kərtənkələ istehsal etməməsi. Ancaq səs-küy aldı və onu təhrif etdilər ki, bala bənzər, şlaka bənzər, quş bənzər xüsusiyyətlərini aşkar etmək və şərh etmək üçün - alqoritmin özü kimi, bunun üzərində məna proqnozlaşdırmağa başlayaq.

Bu düşüncə qatarının kontekstində dərinlikdə daha uzun bir yazı yazdım (burada) və müvafiq bitin xülasəsi aşağıdakı kimidir:

Dərin yaradılan bu görüntülərə baxdığımızda "oh bir bala-şlak və ya quş-kərtənkələ" deyirik. Ancaq əslində belə bir şey yoxdur. Bu görüntülərdə quşlar və ya kərtənkələlər, bala və ya şlaklar yoxdur. Yalnız quş kimi - * bənzər *, puppy- * like *, slug- * like * xüsusiyyətləri var. Süni sinir şəbəkəsi orijinal görüntüdəki bu xüsusiyyətləri, uyğun süni neyronların atəşini tanıyır, lakin zəif və haradasa gizli məkanda. Dərin səs alqoritmi həmin atəşləri artırmaq üçün şəkilləri dəyişdirir. Sonra * biz bu görüntülərə baxırıq və beynimizdəki müəyyən fəaliyyət eyni quş, bala, şlak kimi xüsusiyyətlərini qeydə alır. Ancaq yenə də burada quş və ya bala yoxdur. * * * Bu mənaları müəyyən bir paylama ilə, səs-küy yaradan şeylərə geri proqnozlaşdırmaqla başa çatdırırıq. Mən mübahisə edərdim ki, həqiqətən bütün varlığımızın mahiyyəti budur: səs-küyün xüsusi paylanmasının mənasını vermək.

İnsan qərəzinə qarşı öyrənildi

Bu araşdırmaları edərkən eyni zamanda, modellərin öyrəndiyi ictimai qərəzlərə baxan araşdırmalar açıq oldu [1, 2].

ata: həkim: ana: [tibb bacısı]

Xüsusilə, bir nəticə geniş paylaşıldı və başlıqları düzəltdi. "Doktor ata + ana" (məsələn, "ata həkimə ana kimi olur?") Təqdim edildikdə, model "tibb bacısı" nı geri qaytarır. Doğrudursa, bu, təlim məlumatlarından öyrənilən modeldə güclü cinsi qərəzliyin çox açıq bir sübutudur (bu vəziyyətdə, Google Xəbərin 100 milyard sözləri).

Təəssüf ki, bu tamamilə doğru deyil.

Əslində, "king-man + qadın" kimi bir əməliyyat keçirdiyimiz zaman, son nöqtəyə ən yaxın söz həmişə "kraliça" deyildir. "Kral" olma ehtimalı çox yüksəkdir. Əslində, yuxarıda göstərilən bütün əməliyyatlarda adətən ən yaxın söz giriş sorğusunda olan orijinal sözlərdən biridir (yəni padşah, kişi və ya qadın). Beləliklə, bu əməliyyatları yerinə yetirdikdə, giriş sözlərini modelin geri qaytardığı nəticələrdən əl ilə çıxarırıq (yəni süzün, gözdən sal). "Həkim-ata + ana" vəziyyətində model əslində "həkim" sözünü ən yaxın söz olaraq qaytarır, "tibb bacısı" isə 2-ci yaxındır. Əslində modeldən ilk beş söz həkim, tibb bacısı, həkimlər, həkim, diş həkimi (burada sınaya bilərsiniz).

Məqalə müəllifləri açıq şəkildə bildirirlər ki, "[söz yapışdırılması] təlim keçdikləri bazaya xas olan gizli qərəzləri nümayiş etdirir və qərəzli həll yollarını qaytarır ... məsələn ata: həkim: ana: tibb bacısı". Bu fikir hər iki sənəddə dəfələrlə ifadə olunur və əslində öyrənilən qərəz tədqiqatın əsasını təşkil edir.

Halbuki model bu cinsi qərəzi öyrənməmişdir. Model modelindən ən yaxşı nəticə həqiqətən 'həkim' dir, amma bu nəticə nəzərə alınmır və 'tibb bacısı' (2-ci üst nəticə) kağızda, modelin ən yaxşı çıxışı olaraq bildirilir. Bu ya açıq bir yalan (çox şübhə edirəm) və ya kağız müəllifləri tərəfindən yazılmış bir səhv istifadəçisidir (daha çox ehtimal olunur). Ümid edirəm və düşünürəm ki, bu, günahsız bir səhvdir və müəlliflər əslində birbaşa modellə işləmir, ancaq modelə üçüncü tərəf interfeysindən istifadə edirlər. Bu 3-cü tərəfin interfeysi filtrləmə işini aparır və bəlkə də müəlliflər bundan xəbərdar deyillər (məsələn, burada modelin təmizlənməmiş bir onlayn interfeysi və burada süzülmüş bir onlayn interfeysi var - İngilis Google News modelini seçin. Alternativ olaraq, mən python və C ++ kodunu birbaşa modellə oynamaq üçün buraya daxil edin).

Buna baxmayaraq, bu araşdırma xəbərlərdə və sosial mediada viral getdi və geniş şəkildə paylandı - xüsusilə bu nəticə - MIT Technology Review kimi yerlərdə. Bunun bir maraqlı tərəfi budur ki, saxta xəbərlər həqiqətən böyük bir problem olsa da, biz 'intellektual tənqidi düşünənlər' ümumiyyətlə bunu 'qarşı tərəf' - Daily Mail, Breitbart və Facebook-da alt-sağa aid etməyi sevirlər. həmişəkindən daha aktual). Bəs MIT Technology Review niyə 'saxta xəbərlər' göndərir? Niyə hamı bunu Twitter və Facebookda paylaşır? Maşın öyrənmə modellərində qərəz və ədalətsizlik axtaran insanlar tənqidi düşünənlər olmalı deyilmi? "Yaxşı uşaqlar" deyilmi?

Bu başqa bir yazı üçün böyük bir mövzudur, ancaq aşağıdakı layihə üçün motivasiya var, ona görə də qısa şəkildə toxunacağam.

Nəticələrin təfsirində insanın qərəzliliyi təcrübə və ya modeldə yer alan hər hansı bir qərəzdən daha güclü ola biləcəyi görünür. Heç kim buna (bu məqalənin perspektivinə xas olacaq təbii ki, mənə də) toxunulmazdır.

Göründüyü kimi, həmin sənədlərin müəllifləri bu nəticələrin necə və ya niyə əldə olunduğunu şübhə etmədən, word2vec modelində qərəz tapmaq istədilər. Görünür MIT Technology Review, dil modeli ilə bağlı qərəzlilik bildirmək istədi, buna görə araşdırmaya şübhə etmədən etdilər. Axı, niyə bu barədə sual verməlidirlər? Nəticələr bir kağızda idi! (NB. Arxivdəki bir sənəd nəzərdən keçirilmir, hər kəs orada yaza bilər və bunun səlahiyyəti yoxdur. Bir seminarda bir konfrans konfrans və ya jurnal kimi yoxlanılmır).

Bu yazıları Twitter və Facebook-da paylaşan hər kəs, ML modellərindəki öyrənilən gender qərəzləri ilə bağlı hekayələrini bölüşmək istədi, buna görə də MİT Texnologiyanı nəzərdən keçirmək üçün niyə sual verməlidirlər? ya Boston Universitetindəki tədqiqatçılar, yoxsa Microsoft Araşdırma?

Ən əsası, sənədlərdə verilən suallar vacib suallardır və soruşulmalı və müzakirə edilməlidir və mən müəllifləri bunu etdiyinə görə tərifləyirəm (əslində növbəti layihə, bu olmasa idi, ola bilməzdi -) sənədlərdə çox etibarlı olan bir çox başqa araşdırma aparın).

Buna baxmayaraq, biz qorumağımızı necə tərk edəcəyimizi və müttəfiqlərimizi - hekayələr, povestlər və dəlilləri - dəstəklədiyimiz və inandığımız səbəblərlə uyğunlaşdıqda necə tənqid etməyimizi təəccüblü görürəm. Demək olar ki, biz istəyirik. kritik qiymətləndirmə meyarlarımızı rahatlaşdırmaq və "yaxşı bir səbəb" üçün olduqda bir az həqiqətdən yayınmaq (bu, düşüncəmdə çox şeyə səbəb olan bir şeydir və burada klassik bir nümunə ilə qısa yazdım ).

Modeldə öyrənilən qərəzlərin olmamasını təklif etmirəm. Əslində modeldə öyrənilən qərəzsizliklər var, bir modeldə demək olar ki, həmişə qərəz var, buna görə statistika sahəsi ilə başlamaq üçün yaranmışdır! (yəni öyrənmək və bu qərəzliliyi minimuma endirmək - maşın və statistik qərəzlərin qısa tarixi haqqında yazdım).

Sadəcə "həkim-ata + ana = tibb bacısı" bu vəziyyətdə buna nümunə deyil. Bir şey varsa, nəticələrin şərhində, bildirilməsində və paylaşılmasında insanın qərəzliliyinin sübutudur.

Beləliklə, modeldəki cinsi qərəzi necə araşdıracağınız barədə düşünməyə başladım.

@WordOfMathBias

https://twitter.com/wordofmathbias

Bu vaxta qədər dediyim hər şey - səs-küyün mənasını proqnozlaşdırmaq və insan qərəzinə qarşı öyrənmək - bu twitter botu üçün motivasiya oldu.

Bu bot əvvəlkisinə bənzəyir, ancaq modelin təlim məlumatlarından öyrənə biləcəyi ictimai qərəzləri (xüsusən də cinsi əlaqəni) araşdırmaqdan daha çox. 'Kişi' və 'qadın' ilə təsadüfi söz bənzətmələrini axtarır və onları hər iki istiqamətdə işlədir.

Yəni silmədikdə, "kişi: həkim: qadın:?" Doktoru qaytarır, çox maraqlı deyil, model və ya məlumatlar haqqında çox məlumat əldə etmirik. Süzülürsə, tibb bacısını alırıq, bu da maraqlıdır, amma öz-özünə çox şey demir. Yəni bunu “kişi həkimə, qadın tibb bacısı olduğu üçün” iddia edən model kimi şərh etmək olmaz (bax: əvvəlki hissəyə).

Ancaq 'kişi' və 'qadın' tərsini dəyişdirsək və 'qadın: həkim :: kişi:?' və nəticələri filtrləyin, 'həkim' alırıq. İndi maraqlıdır və düşündüyüm modelə daha çox işıq saçır. Həm "kişi: həkim", həm də "qadın: həkim" üçün ən yüksək (süzülməmiş) nəticə yenə də "həkim", qadın üçün ikinci ən yüksək nəticə "tibb bacısı", kişi üçün ikinci ən yüksək nəticə "həkim" dir. Bu, modellə əlaqəli bir qərəzdir, təlim məlumatlarından öyrənildi. Görəsən başqa nə var?

Beləliklə, bu bot söz qoşmalarını bu şəkildə araşdırır. Tamamilə təsadüfi bir söz seçir, vektoru 'kişi' sözündən 'qadına' əlavə edir və nəticələri qaytarır. Ayrıca 'qadın' sözündən 'kişi' sözünə vektor əlavə edir və nəticələri qaytarır. Hər iki halda, ilk dörd nəticəni qaytarır və yer qənaət etmək üçün giriş sorğu sözlərini süzgəcdən keçirir.

Çox elmi deyil, daha çox təsadüfi bir araşdırma. Ancaq əslində, modeldəki öyrənilmiş qərəzləri araşdırmaqla yanaşı, şərhlərimizdəki insan qərəzlərini də araşdırır. Eynilə @wordofmath bot məsələsində olduğu kimi, nəticələrin üzərində məna verməyə necə cəhd etdiyimizi görmək maraqlıdır. Bot həqiqətən təsadüfi bir söz seçdiyindən (yəni ağ səs-küy, vahid paylama), nəticələri tez-tez şərh etmək olduqca çətindir. Əvvəllər olduğu kimi, bu struktur səs-küydən oxumaq istədiyimizi oxuduq.

Məsələn

Təsadüfi söz 'istənir', qadın 'razı' və ya 'tələb edir', kişi isə 'təlimat verir' və ya 'razıdır'. Bu mənəm, yoxsa kişinin sözlərində daha çox müsbət bir məna var kimi görünür? Bu təlim məlumatları haqqında bir şey söyləyirmi? yoxsa mən çox oxuyuram? Model haqqında bir şey söyləyir? Yoxsa mənim haqqımda və düşüncə tərzim haqqında daha çox danışır? 10 il əvvəl bu nəticələrimi bugünkü vəziyyətimlə müqayisədə necə şərh edərdim? 10 ildə bunları necə şərh edim?

Təsadüfi söz 'bəyənir', bir qadın 'pərəstiş edir' və ya 'ləzzət alır', kişi isə 'rahatlayır' və ya 'bilir'. Kişi 'bilir' bir qadın necə 'zövq alır'? Bu bir şey deməkdirmi? Yoxsa bu, üzən nöqtələrin yuvarlaqlaşdırma səhvləri səbəb olduğu qədər təsirsiz ola bilərmi?

Təsadüfi söz 'personajlar'dırsa, qadın' qəhrəmanlar 'və ya' aktrisalar ', kişi isə' cani 'və ya' canavarlar'dır.

Təsadüfi söz 'maşınlar'dırsa, fərqli olan yeganə söz qadın üçün' sedan 'və kişi üçün' çənlər 'dir. Güman edirəm ki, qadın mikroavtobus sürücülərinə daha çox rast gəlinir. Bu təsadüfdür? Yoxsa model bunu həqiqətən öyrənib?

Bu çox maraqlıdır, əgər təsadüfi bir söz 'çeynənir', qadın üçün yeganə fərqli söz 'yeyilir' və kişi üçün 'yırğalanır'. Şəxsən danışsam, 'yırtılmış' mənim necə yediyim haqqında olduqca dəqiq bir açıqlamadır. Ancaq bu anda çox oxuduğumu bilmirəm.

Qadınlar daha çox 'vəkillik' və ya 'xeyriyyə', kişilər 'komanda' və ya 'klub' ilə əlaqəli olurlar. Yenə də bu inandırıcı səslənir.

Qadınlara aid 'sosial' məsələlərə 'gender', 'analar', 'rifah', kişilər üçün isə 'sosioloji', 'gənclik' və 'intellektual' daxildir.

'Göz qapaqlarına' cavab olaraq qadınlarda 'vagina' və 'yanaqlar', kişilərdə 'burun' və 'aln' var.

Nəhayət

Qadın 'çəllək' və ya 'qab', kişinin 'çömçə' və ya 'soyuducu' olmasıdır. Bu nə deməkdir və ya nə deməkdir? Əminəm ki, bunlar zehni düşünsələr, bu bir inşa üçün başlanğıc nöqtəsi kimi istifadə edə bilər. "Saqqallı əsaslı yer + doktrina = ilahiyyat, və'z" nümunəsi ilə etdiyim kimi.

Sual verdiyiniz sual nə qədər gülünc olursa olsun, bir nəticə qaytaracaq. Yenə də mənim ən çox sevdiyim sitatlardan birini xatırladıram (bunları statistik qərəzlilik tarixi ilə bağlı yazıma daxil edirəm):

[Balamın hesablama maşınlarında] “İki dəfə [məclis üzvləri] mənə sual verdilər,
'Dua edin, cənab Babbam, maşına səhv rəqəmlər qoyursanız, düzgün cavablar çıxacaqmı?'
Mən belə bir suala səbəb ola biləcək fikirlərin qarışıqlığını düzgün anlaya bilmirəm. ” - Çarlz Babb (1791–1871), "Filosofun həyatından keçidlər", 1864

Şübhə yoxdur ki, söz qoşmaları, sözlərin fəza baxımından yüksək ölçüdə yerləşdirilməsini bir növ mənalı münasibətləri özündə cəmləşdirməyi öyrənə bilər. Buraya təlim məlumatlarında yer alan qərəzlər daxildir. Və bu cür modelləri tənqidi qərar vermə üçün istifadə edərkən, bu cür qərəzlərdən qaynaqlanan hər hansı ayrıseçkilik, xüsusilə də bir növ əlverişsiz vəziyyətdə olanlar üçün çox mənfi nəticələrə səbəb ola bilər.

Bununla qarışıq olaraq, tez-tez bu nəticələr "təsadüfi" və "qurulmuş" bir-birinə o qədər həssas şəkildə yerləşdirilir ki, bəzən onların arxasında hər hansı bir mənanın olub olmadığını bilmək çox çətindir, yəni modeldə yerləşmiş qərəzlər varmı? sadəcə görmək istədiyimizi proqnozlaşdırırıq, nəticələrin şərhində öz qərəzlərimizi ifşa edirik. Bəzən bir modelin nəticəsinə çox məna vermək, İsanın üzünü bir parça tostda görmək və bunun Tanrıdan gələn bir mesaj olduğuna əmin olmaq kimi bir şey ola bilər.

Bəzi hallarda bu həmişə pis bir şey deyil. Fikirli bir fikir tapıram, ML modellərini və gizli boşluqları məna filtri kimi istifadə etmək, öz qərəzlərimizi və qavrayışlarımızı sorğulamaq - səs-küyün vahid paylanmasını (yəni tamamilə təsadüfi, yəni ağ səs-küy) və onları bir qədər daha strukturlaşdırılmış səs-küyə bükmək , müxtəlif fərqli sahələr üçün parametrik Rorschach inkblot generatorları kimi.

Sonra istehsal olunan əsərləri başlanğıc nöqtəsi kimi, xəyalımızda çiçək açan, şeyləri gördüyümüz, layihə mənasını verdiyimiz, milyonlarla ildir etdiyimiz kimi, ətrafımızda hekayələr yaratdığımız və istifadə etdiyimiz kimi istifadə edə bilərik.

NB. Bu "səs-küy üzərində proqnozlaşdırma" və digər öz-özünə xidmət edən qərəzlər, şübhəsiz ki, idrakın və əslində həyatın bütün cəhətlərini, maşın öyrənmə modellərinin nəticələrini şərh etməkdən daha yaxşıdır. bu gün görürəm. Şübhəsiz ki, yaxın gələcəkdə bu mövzular üzərində daha çox işləyəcəyəm.

Əslində, hər dəfə “nə deməkdir?” Termini barədə düşünəndə Mən yosemitebear62'nin ikiqat göy qurşağı videosunu və bu möhtəşəm fenomen üzərində layihələndirmək səylərini düşünə bilmirəm:

və izahatının son 30 saniyəsində daha da nümunə oldu:

Təşəkkürlər

Doktoranturamın bir hissəsi olaraq bu sahədə davam edən araşdırmalarımdan əlavə, bu iş Google Rəssamları və Maşın Zəkası Proqramında bir rezidentura tərəfindən dəstəkləndi. Bu həcmdə dəstək, ruhlandırıcı söhbətlər və təkliflər üçün Kenric McDowell, Mike Tyka, Andrea Held, Blaise Aguera y Arcas və digərlərinə təşəkkür edirəm. Burada danışacağım iş və fikirlər də bir çox başqalarından ilham aldı, amma Allison Parrish və Ross Quduinə xüsusi bir qışqırıq vermək istərdim.