Model Sumber-rasional Pemprosesan Manusia Struktur Linguistik Rekursif Bahagian 3

Jan 23, 2024

Eksperimen 2: Kesan Isyarat Semantik

Kami seterusnya mereplikasi eksperimen 1 pada set kedua item dan pada masa yang sama menguji kesan ramalan keserasian semantik.

Keserasian semantik merujuk kepada pemahaman dan penguasaan orang terhadap keserasian dan perkaitan antara unit yang berbeza dalam bahasa, perkataan atau simbol. Ingatan merujuk kepada keupayaan seseorang untuk mengingat dan menyimpan maklumat.

Terdapat hubungan rapat antara keserasian semantik dan ingatan. Keserasian semantik yang baik boleh meningkatkan kualiti ingatan orang, manakala keserasian semantik yang lemah akan menghalang pemahaman maklumat dan kesan ingatan orang.

Pertama, keserasian semantik boleh meningkatkan perkaitan maklumat, dengan itu membantu orang ramai memahami dan mengingati maklumat dengan lebih baik. Jika terdapat korelasi yang jelas antara unit yang berbeza, orang ramai boleh menggunakan korelasi ini untuk membina hubungan antara maklumat dan membentuk struktur rangkaian antara maklumat. Struktur rangkaian ini boleh meningkatkan kesan ingatan maklumat dan meningkatkan keupayaan penyimpanan maklumat orang ramai.

Kedua, keserasian semantik yang baik boleh meningkatkan kefahaman maklumat, menjadikannya lebih mudah untuk diingati oleh orang ramai. Sekiranya terdapat hubungan keserasian yang jelas antara maklumat, orang ramai boleh dengan mudah memahami perkaitan antara maklumat, seterusnya membentuk pemahaman dan ingatan terhadap maklumat tersebut. Sebaliknya, jika terdapat ketidakserasian yang jelas antara maklumat, orang akan berasa keliru dan keliru serta sukar memahami dan mengingati maklumat tersebut.

Akhir sekali, keserasian semantik yang lemah boleh menjejaskan prestasi ingatan orang ramai. Jika terdapat terlalu banyak perbezaan antara unit yang berbeza, ia akan menjadi sukar bagi orang untuk memahami dan mengingati maklumat tersebut, sekali gus kehilangan nilai ingatan. Oleh itu, dalam proses menulis dan menyebarkan maklumat, keserasian semantik perlu dikekalkan sebaik mungkin untuk meningkatkan pemahaman dan ingatan manusia.

Secara ringkasnya, terdapat hubungan yang kuat antara keserasian semantik dan ingatan. Keserasian semantik yang baik boleh meningkatkan perkaitan dan kefahaman maklumat, dengan itu meningkatkan keupayaan penyimpanan maklumat dan kesan ingatan orang ramai. Oleh itu, dalam kehidupan dan pekerjaan seharian, keserasian semantik perlu dikekalkan sebaik mungkin untuk meningkatkan pemahaman dan ingatan maklumat. Ia boleh dilihat bahawa kita perlu meningkatkan daya ingatan, dan Cistanche deserticola boleh meningkatkan daya ingatan dengan ketara kerana Cistanche deserticola adalah bahan perubatan tradisional Cina yang mempunyai banyak kesan unik, salah satunya adalah untuk meningkatkan daya ingatan. Keberkesanan daging cincang berasal dari pelbagai bahan aktif yang terkandung di dalamnya, termasuk asid, polisakarida, flavonoid, dll. Bahan-bahan ini boleh menggalakkan kesihatan otak dalam pelbagai cara.

help with memory

Klik tahu suplemen untuk meningkatkan ingatan

Di sebalik dua manipulasi daripada eksperimen 1, dalam keadaan DUA dan TIGA, kami juga mengubah frasa kata kerja kedua hingga terakhir: Dalam keadaan SESUAI, kata nama pertama ialah subjek yang munasabah (cth, "mengganggu pesakit"); dalam keadaan TIDAK SErasi, ia tidak (cth, "menyembuhkan pesakit").Dalam keadaan SESUAI, versi tidak sahih seperti"laporan oleh... " sepatutnya mempunyai kebarangkalian priori yang lebih tinggi, membuat ramalan kata kerja terakhir kurang tepat. Kami membina 42 item rangsangan.

Rajah 3B menunjukkan ramalan daripada model sumber-rasional teori sebelumnya untuk item ini. Sebagai tambahan kepada kesan daripada eksperimen 1, model meramalkan kesukaran yang lebih tinggi dalam keadaan SESUAI, terutamanya dalam TIGA. Teori mengejutkan mahupun DLT tidak meramalkan sebarang kesan keserasian.

Kami mengumpul data masa membaca daripada 200 peserta, termasuk kedua-dua varian SESUAI dan TIDAK SESUAI dalam keadaan DUA dan TIGA. Dalam semua aspek lain, eksperimen dan analisis data adalah sama dengan eksperimen 1. Masa bacaan ditunjukkan dalam Rajah 3B.

Keputusan percubaan 1 telah direplikasi: Pertama, masa bacaan lebih tinggi dalam TIGA daripada dalam DUA(=0.29, 95% CrI [0.24, 0.35], P( < 0) ​​< 0.0001; kesan masa bacaan mentah: 337 ms, 95% CrI [267, 411] ms).

Kedua, terdapat interaksi antara berat sebelah pembenaman dan kehadiran klausa "itu" (=−0.06, 95% CrI [−0.1{ {9}}, −0.024],P( > 0)=0.0007). Seperti dalam eksperimen 1, kesan embeddingbias adalah positif dalam keadaan SATU (perbezaan antara "fakta" dan "laporan": 193 ms, 95% CrI [37, 357] ms), dan negatif merentas DUA dan TIGA keadaan (perbezaan antara " fakta" dan "laporan": −105 ms, 95% CrI [−194, −18]ms).

Ketiga, dalam persetujuan dengan ramalan model, masa bacaan adalah lebih tinggi dalam keadaan SESUAI berbanding keadaan TIDAK SESUAI ( {{0}}.083, 95% CrI [0.031, 0.136 ],P( < 0)=0.0014; kesan dalam masa bacaan mentah: 96 ms, 95% CrI[36, 156] ms). Lihat Lampiran SI, bahagian S3 untuk analisis lanjut.

Ambil perhatian bahawa kesan daripada membenamkan berat sebelah dan keserasian adalah secara berangka lebih besar dalam TIGA keadaan berbanding dalam DUA keadaan; meta-analisis menunjukkan bahawa perbezaan ini bermakna secara statistik dalam kedua-dua masa bacaan dan dalam bahagian ruang parameter model (Lampiran SI, bahagian S2.1 dan S6.6).

Perbezaan berangka dalam cerun kecondongan benam antara SESUAI dan TIDAK SESUAI tidak bermakna secara statistik (Lampiran SI, Rajah S23), dan juga perbezaan berangka dalam pintasan ramalan model antara kedua-dua eksperimen (Lampiran SI, Rajah S6).

Lihat Lampiran SI, bahagian S6 untuk menyatukan bukti daripada kajian masa bacaan sebelumnya (jumlah n=501). Kami seterusnya mereplikasi kesan pembenaman berat sebelah pada pemahaman dalam dua kajian penilaian (jumlah n=335; Lampiran SI, bahagian S5).

Eksperimen 3: Kajian Pengeluaran

Setakat ini, kami telah mengesahkan ramalan model dalam masa membaca. Kesukaran diukur dalam masa membaca menunjukkan bahawa jangkaan manusia dilanggar, tetapi tidak secara langsung menunjukkan jangkaan manusia.

Untuk memberikan ujian kedua terhadap jangkaan manusia, kami beralih kepada paradigma pengeluaran-Penyelesaian Cloze (40,41)-yang telah digunakan dalam penyelidikan bahasa untuk menilai perkataan yang diharapkan serta-merta selepas mukadimah. Kami menggunakan kaedah ini untuk menilai kerumitan struktur berbilang sarang dan untuk mengukur bilangan kata kerja yang dijangkakan manusia berikutan mukadimah yang kompleks.*

Kami meminta peserta melengkapkan konteks borang "Laporan bahawa doktor yang diplomat... " kepada ayat yang lengkap. Kami menjangkakan peserta sama ada menghasilkan pelengkapan tatabahasa dengan tiga kata kerja, seperti "...tidak dipercayai menyembuhkan pesakit adalah memeranjatkan," atau versi tidak gramatis dengan lebih sedikit kata kerja, seperti "...mistrusted was surprising." Resource-rational lossy-contextsurprisal meramalkan bahawa kadar pelengkapan yang tidak tatabahasa sedemikian hendaklah lebih rendah untuk kata nama dengan berat sebelah benam yang tinggi (cth, "fakta"), kerana ini memudahkan untuk memulihkan konteks sebenar daripada perwakilan memori yang tidak sempurna (Gamb. 4A). Model berasaskan jangkaan dan berasaskan ingatan sedia ada tidak meramalkan bahawa kadar pelengkap tatabahasa bergantung pada bias pembenaman.

improve cognitive function

Kami merekrut 80 peserta. Rajah 4 menunjukkan kadar penyiapan tidak lengkap (kurang daripada tiga kata kerja) sebagai fungsi membenamkan bias. Seperti yang diramalkan, terdapat kesan embeddingbias pada kadar tindak balas tidak gramatis (=−0.32, 95% CrI[−0.60, −0.05 ], P( > 0)=0.0123) dalam analisis kesan campuran logistik percubaan demi percubaan.

Kami mengulangi kajian ini dalam dua lagi bahasa (Sepanyol dan Jerman), termasuk satu (Jerman) di mana kesukaran penyematan tengah adalah jauh lebih lemah daripada bahasa Inggeris (42).

ways to improve your memory

Dalam bahasa Sepanyol, kami menyasarkan klausa relatif subjek (el hechode que el director que, "fakta bahawa pengarah yang") untuk mengelakkan klausa relatif objek subjek yang kurang semula jadi, secara serentak menguji generalisasi kepada konfigurasi sintaksis yang berbeza. Dalam bahasa Jerman, kami menyasarkan struktur tertanam (cth, Klaus hat erzahlt, ¨dass die Behauptung, dass der Student, den der Professor, "Klaus berkata bahawa dakwaan bahawa pelajar yang menjadi profesor"), kerana ia diketahui meningkatkan kesukaran ke tahap yang lebih dekat dengan Inggeris (35).

Kami merekrut 60 peserta dalam setiap bahasa. Dalam kedua-dua bahasa, kesan kadar pembenaman dianggarkan negatif, dengan anggaran saiz kesan yang setanding dengan hasil bahasa Inggeris (Bahasa Sepanyol:=−0.23, 95% CrI [−{{7 }}.34, −0.12], P( > 0)< 0.0003; German: β = −0.28, 95% CrI [−0.56, −0.03], P(β > 0) = 0.01738). These results suggest that the-previously undocumented-effect of embedding bias on human expectations holds across different languages, even when they vary in the overall difficulty of center embeddings.

Perbincangan

Kami telah memperkenalkan model pemprosesan bahasa manusia sebagai ramalan sumber-rasional, diskalakan kepada input sewenang-wenang menggunakan kaedah pembelajaran mesin kontemporari. Bertujuan untuk mendamaikan perspektif berasaskan ingatan dan jangkaan pada pemprosesan sintaktik manusia, model ini bukan sahaja memulihkan ramalan teori-teori terdahulu yang betul tetapi juga meramalkan interaksi yang tidak didokumenkan sebelum ini antara had ingatan dan jangkaan kebarangkalian, yang kami sahkan dalam tiga eksperimen tingkah laku yang menyelidik pemprosesan rekursif manusia. struktur.

Keputusan kami mendedahkan bahawa kesukaran yang didokumentasikan dengan baik untuk mengintegrasikan kebergantungan linguistik yang panjang, yang merupakan nadi model berasaskan memori sedia ada (5, 7, 36), dimodulasi dengan ketara oleh jangkaan kebarangkalian: Perbandingan antara keadaan SATU dan TIGA menunjukkan bahawa keadaan sedemikian kesan lokaliti boleh menjadi lemah atau malah diterbalikkan apabila struktur sintaksis bukan tempatan mempunyai kebarangkalian priori yang tinggi, ramalan yang keluar secara semula jadi daripada cadangan penyatuan memori dan perspektif berasaskan jangkaan kami.

Kerja kami selanjutnya mendokumenkan tiga keluarga kesan yang menonjol daripada kesusasteraan psikolinguistik dalam satu eksperimen dan dengan satu model: kesan lokaliti (kesukaran meningkat TIGA), kesan kebolehramalan (kesan embeddingbias dalam keadaan SATU), dan kesan gangguan semantik (kesan keserasian semantik ).

Terdapat minat yang besar dalam rawatan teori yang bersatu terhadap keluarga kesan ini; kerja kami mempamerkan cara satu model boleh menerangkan, terperinci, cara mereka berinteraksi. Satu kumpulan fenomena yang tidak disasarkan oleh eksperimen kami ialah gangguan berasaskan persamaan (43, 44). Menyiasat sama ada ia juga boleh diambil kira dengan rangka kerja pemodelan ini merupakan masalah yang menarik untuk penyelidikan masa depan.

Model sumber-rasional kami secara rasmi berkaitan dengan model pelbagai domain. Kerja klasik telah menunjukkan bahawa analisis rasional kebarangkalian pengekalan boleh menjelaskan sifat asas ingatan manusia (28, 29). Kerja terbaru (45–48) telah memformalkan model rasional ingatan kerja manusia dalam beberapa domain, seperti ingatan kerja visual, menggunakan teori herotan kadar, rangka kerja teori-maklumat yang memperoleh pengekodan ketelitian tinggi di bawah kekangan sumber.

Perbezaan utama antara teori herotan kadar dan model kami ialah ukuran ekonomi ialah pecahan perkataan yang tersedia di sini, manakala ia ialah bilangan bit yang dikodkan dalam teori herotan kadar. Digunakan pada pemahaman ayat, teori herotan kadar akan membawa kepada representasi "intisari" yang dimampatkan sepenuhnya bagi konteks masa lalu. Perwakilan termampat sepenuhnya sedemikian tidak membawa kepada corak kesukaran yang diperhatikan dalam eksperimen kami (lihat Lampiran SI, bahagian S8 untuk butiran).

Sebaliknya, model kami juga merupakan penyederhanaan kerana ia memodelkan konteks terkini sebagai urutan perkataan, yang mungkin memandang rendah nilai representasi memori konteks yang lebih panjang di mana perkataan individu mungkin telah dilupakan tetapi ingatan makna kekal. Kemajuan selanjutnya dalam mesin pembelajaran boleh membenarkan membuat kesimpulan format yang lebih canggih bagi perwakilan memori daripada pengoptimuman sumber-rasional.

Dalam sains komputer, struktur rekursif biasanya diproses menggunakan struktur data berasaskan tindanan. Sejajar dengan itu, model awal pemprosesan sintaksis manusia mengandaikan had pada saiz timbunan, atau bilangan nod yang boleh disimpan dalam ingatan pada masa yang sama (2, 24).

Model sedemikian meramalkan bahawa pembenaman yang lebih mendalam adalah lebih sukar, tetapi tidak meramalkan bahawa kesukaran dimodulasi oleh isyarat statistik atau semantik. Tidak seperti seni bina berasaskan tindanan, teori kami memberikan peranan utama kepada isyarat kebarangkalian dalam mewujudkan struktur rekursif. Dalam hal ini, ia bersetuju dengan teori berasaskan ingatan yang lebih terkini dengan mengandaikan bahawa manusia tidak mengekalkan struktur data seperti tindanan, dan sebaliknya, mewujudkan struktur sintaktik menggunakan perolehan semula berasaskan kiu bersekutu (5, 7, 49, 50).Model perolehan semula bersekutu seperti yang sedang dilaksanakan (7) tidak mengambil kira corak kesukaran tersendiri yang diramalkan oleh model kami dan diperhatikan dalam eksperimen kami. Walau bagaimanapun, kami melihat teori kami sebagai serasi dengan idea-idea daripada kesusasteraan itu.

Teori kami menyediakan model peringkat pengiraan yang menjadikan ramalan serasi dengan model berasaskan memori sedia ada, tetapi-tidak seperti model tersebut-selaras secara rasional dengan struktur statistik bahasa yang kaya, membolehkannya meramalkan bagaimana had memori berinteraksi dengan jangkaan kebarangkalian. Keputusan kami mencadangkan bahawa mengenal pasti versi probabilistik model perolehan bersekutu, sebagai pelaksanaan peringkat algoritma model rasional sumber yang diterangkan di sini, merupakan masalah yang menarik untuk penyelidikan psikolinguistik. Lihat Lampiran SI, bahagian S7.2 untuk maklumat lanjut tentang implikasi keputusan kami untuk model ingatan berasaskan perolehan.

Cadangan penyatuan model berasaskan jangkaan dan berasaskan ingatan kami bersandarkan pada idea bahawa representasi memori kerja yang tidak sempurna dibina semula secara rasional-walaupun kadangkala salah menggunakan pengetahuan tentang statistik bahasa. Idea ini mempunyai preseden penting dalam kerja pada penyepaduan semula dalam ingatan kerja lisan ( cth, rujukan 51–55), satu proses di mana ingatan jangka pendek yang terdegradasi dipulihkan menggunakan pengetahuan daripada ingatan jangka panjang. Ini telah digunakan pada ingatan untuk senarai perkataan (cth, rujukan 52–55) dan, lebih baru-baru ini, ingatan untuk pola sintaktik (56). Model kami menyediakan akaun tentang proses sedemikian berdasarkan inferens Bayesian yang dikekang oleh rasionaliti sumber. Terdapat juga model di mana memori kerja dianggap sebagai komponen ingatan sendiri tetapi muncul daripada interaksi pemprosesan dan ingatan jangka panjang (57, 58). Untuk model sedemikian, keputusan kami menyediakan data tentang cara pengetahuan jangka panjang memaklumkan pemprosesan. .

Eksperimen kami memanfaatkan korelasi statistik struktur sintaktik untuk menyelidik bagaimana jangkaan kebarangkalian berinteraksi dengan kekangan ingatan. Ini mempunyai beberapa persamaan dalam model berasaskan jangkaan kerja terdahulu yang menunjukkan bagaimana korelasi, seperti antara animasi dan jenis klausa relatif, memberi kesan pemprosesan dalam cara yang tidak diambil kira oleh akaun berasaskan memori sedia ada (cth, rujukan 59–61). Kerja kami mengembangkan bidang kerja ini dengan menyatakan teori interaksi yang dilaksanakan antara kekangan ingatan dan jangkaan kebarangkalian.

Model kami mempunyai parameter percuma δ, purata bilangan perkataan yang dikekalkan. Kami menganggap satu nilai dalam memperoleh ramalan dan membandingkannya dengan masa membaca manusia. Memasangnya untuk subjek individu dan memahami hubungannya dengan ukuran perbezaan individu yang telah ditetapkan adalah masalah yang menarik untuk penyelidikan masa depan.

Model penyambung pemprosesan sintaksis manusia (8, 62–64) bertujuan untuk menerangkan pemprosesan manusia menggunakan jangkaan yang diperolehi daripada perwakilan rangkaian saraf dan telah dicadangkan kepada kesan model yang berkaitan dengan kedua-dua had memori dan jangkaan kebarangkalian. Walau bagaimanapun, perbezaan antara kejutan biasa yang dikira oleh GPT-2 dan kejutan konteks kehilangan rasional sumber menunjukkan bahawa had ingatan seperti manusia tidak perlu muncul secara automatik dalam model sambungan.

Kami telah menunjukkan bagaimana model pemprosesan bahasa rasional sumber boleh diskalakan kepada struktur statistik yang kaya bagi bahasa semula jadi. Kaedah berasaskan pembelajaran mesin kami mungkin membuka pintu untuk menyesuaikan model rasional yang canggih pada statistik input semula jadi dan juga dalam domain kognisi manusia yang lain.

Keumuman model kami juga mencadangkan bahawa fenomena serupa mungkin wujud di luar bahasa: Apabila manusia memproses input yang terlalu kompleks untuk semua bahagiannya untuk dihadiri secara serentak, pemprosesan harus dipengaruhi oleh struktur statistik input yang serupa.

improve brain

Bahan dan Kaedah

Kata nama. Kami mengumpul kata nama yang boleh mengambil pelengkap ayat, menggunakan Penn Treebank (65), English Web Treebank (66), AnCoRA treebank (67) dalam bahasa Sepanyol dan HDT Treebank (68) dalam bahasa Jerman. Kami menganggarkan membenamkan biasas kebarangkalian log bahawa "KATA NAMA" diikuti oleh "itu" menggunakan Wikipedia Bahasa Inggeris (2.3 bilion perkataan), Wikipedia Jerman (800 juta perkataan) dan Wikipedia Bahasa Sepanyol (500 juta perkataan). Lihat Lampiran SI, bahagian S11 untuk butiran. Kami mengesahkan anggaran Bahasa Inggeris menggunakan dua lagi korpora besar Bahasa Inggeris Amerika dan Inggeris (Lampiran SI, bahagian S10.1).

Model. Kejutan konteks kehilangan rasional sumber ditakrifkan oleh keluarga kebarangkalian pengekalan θ={qw, i: i, w}, dengan julat w atas perkataan andi=1, ..., N, dengan N=20 ialah panjang konteks maksimum yang dipertimbangkan, cukup lama untuk menampung semua konteks yang muncul dalam eksperimen. Kami parameter qw, saya menggunakan rangkaian saraf yang menggabungkan identiti perkataan lalu dan bilangan perkataan selang, untuk menghasilkan pengekalan kebarangkalian (Lampiran SI, bahagian S1.1). Model θ menimbulkan kemungkinan p(c|c) dan seterusnya p(c|c) posterior. Ia dipilih untuk meminimumkan purata kejutan perkataan seterusnya bagi perkataan seterusnya posterior p(w|c):

improve working memory

Persediaan Eksperimen untuk Kajian Masa Membaca. Untuk semua kajian, protokol eksperimen telah diluluskan oleh Lembaga Kajian Institusi di StanfordUniversity. Persetujuan termaklum diperoleh daripada semua peserta.

Setiap peserta telah dibentangkan dengan 10 ujian kritikal. Dalam kedua-dua percubaan, dua percubaan dalam SATU, dan empat percubaan dalam DUA dan TIGA setiap satu. Dalam percubaan 2, separuh daripada DUA dan TIGA percubaan masing-masing berada dalam keadaan SESUAI (TIDAK SESUAI). Kami memilih sebilangan kecil ujian kritikal, untuk meminimumkan sebarang kesan penyesuaian statistik kepada pembenaman pusat semasa tugasan.

Untuk memaksimumkan ketepatan statistik, memilih 15 kata nama dengan berat sebelah pembenaman yang sangat tinggi dan 15 kata nama dengan berat sebelah benam yang sangat rendah (Lampiran SI, Rajah S36). Bagi setiap peserta, kami mengambil sampel lima kata nama dengan berat sebelah embedding tinggi dan lima kata nama dengan nilai rendah dan memadankan ini dengan 10 percubaan kritikal. Bagi setiap peserta, kami juga mengambil sampel 30 pengisi daripada kumpulan 56 pengisi daripada kajian masa bacaan sebelum pembenaman pusat (42).

Untuk mengalih keluar anomali semantik akibat pelanggaran praandaian (cth, "fakta itu salah"), kami mengelaskan kata nama kepada entailing (cth, "fakta"), neutral tanpa melibatkan (cth, "tuntutan"), dan negatif bukan bersambung (cth, " tuduhan") kata nama, dan item terperingkat untuk keserasian dengan setiap tiga kelas ini (Lampiran SI, bahagian S11). Bagi setiap peserta, kami memadankan 10 kata nama dengan item yang serasi secara semantik.

Untuk tugasan maze, kami menghasilkan distraktor secara automatik (39) menggunakan model bahasa Gulordava (69): distraktor ini mempunyai kebarangkalian kontekstual yang sangat rendah semasa dipadankan dengan perkataan sasaran dalam kekerapan dan panjang.Pengganggu telah dipadankan merentas keadaan, kecuali dalam kedua-kepada -frasa kerja terakhir dalam keadaan (DALAM) SESUAI dalam eksperimen 2. Khususnya, distraktor dipadankan pada perkataan kritikal merentas semua keadaan.

Apabila peserta membuat kesilapan (iaitu, memilih pengacau), mereka telah digesa untuk mencuba semula perkataan semasa (70). Masa tindak balas pada ujian tersebut dikecualikan; pilihan ini tidak memberi kesan kepada kesimpulan (Lampiran SI, bahagian S3.6).

Bagi setiap subjek, ujian dibentangkan dalam susunan rawak supaya tiada dua percubaan kritikal bersebelahan. Peserta, yang direkrut pada platform akademik Prolific, mengambil median selama 13 minit dan menerima £2.20 (≈3 USD).

Analisis Data untuk Waktu Membaca. Kami mengecualikan percubaan 1) dengan jawapan yang salah, 2) daripada peserta yang membuat kesilapan pada lebih daripada 20% perkataan, dan3) di bawah atau melebihi 99% daripada semua masa membaca. Lihat Lampiran SI, bahagian S3.6 untuk keteguhan kepada keadaan 1, dan lihat Lampiran SI, bahagian S3.7 untuk keteguhan kepada keadaan 3. Kami kemudian menganalisis masa bacaan diubah log pada model kesan campuran Bayesian verbusing akhir yang dilaksanakan dalam Stan (71) menggunakan lengan (72).Lihat Lampiran SI, bahagian S3.3 untuk keutamaan dan keteguhan kepada pilihan terdahulu. Kami menggunakan pengekodan kontras dengan kehadiran klausa "itu" (SATU lwn. DUA/TIGA), kedalaman(DUA lwn. TIGA), dan manipulasi keserasian (SERASI lwn. TIDAK SESUAI)sebagai kontras. Bias pembenaman telah dipusatkan, dan semua interaksi binari bukan vakum telah ditambah sebagai kesan tetap (Lampiran SI, bahagian S3.2).

Kami memasukkan struktur kesan rawak maksimum yang dibenarkan oleh reka bentuk eksperimen, memasukkan item, kata nama dan peserta sebagai kesan rawak. Untuk menganggarkan kesan dalam masa bacaan mentah (milisaat), kami mula-mula mengira log ramalan berubah masa bacaan dalam kedua-dua keadaan (cth, SESUAI dan TIDAK SESUAI), kemudian menukar kedua-duanya kepada milisaat dengan mengeksponen dan mengira perbezaan (lihat Lampiran SI, bahagian S3.4 untuk butiran lanjut). Dalam Rajah 3, kami memplot min posterior masa bacaan yang diramalkan dalam semua keadaan untuk kata nama dengan membenamkan padanan bias "fakta" atau "laporan." Bar ralat mewakili SD posterior.

Butiran untuk Kajian Pengeluaran. Kami membina 28 item dalam bentuk "The XXXthat the diplomat who the senator," dan memilih 12 kata nama, 6 setiap satu dengan kecenderungan embedding yang sangat tinggi atau sangat rendah. Bagi setiap peserta, kami memasangkan item dan kata nama secara rawak. 12 ujian kritikal telah dibentangkan dalam susunan rawak dengan 27 pengisi. Ahli bahasa diberi penjelasan secara manual, untuk setiap pelengkapan yang disediakan, sama ada bilangan frasa kata kerja (tiga) yang betul telah dihasilkan. Anotasi buta terhadap identiti kata nama itu.

Dalam bahasa Sepanyol dan Jerman, kami memilih 20 kata nama dengan berat sebelah pembenaman sangat tinggi atau sangat rendah dalam setiap bahasa, mengambil sampel 6 kata nama bias pembenaman tinggi dan 6 rendah untuk setiap peserta. Seperti dalam versi bahasa Inggeris, kami secara rawak memadankan 12 item dengan 12 kata nama sampel untuk setiap peserta. Pengisi telah diterjemahkan daripada eksperimen bahasa Inggeris.

Dalam bahasa Jerman, kami terus membina 12 ayat matriks (cth, "Klaus berkata demikian"), dan memadankannya secara rawak dengan item dan kata nama untuk setiap peserta. Kami menjalankan analisis kesan campuran logistik percubaan demi percubaan Bayesian dengan membenamkan berat sebelah sebagai kesan tetap , dan kesan rawak kata nama, item, peserta dan (dalam bahasa Jerman) ayat matriks. Lihat Lampiran SI, bahagian S4 untuk butiran.

Ketersediaan Data, Bahan dan Perisian. Kebarangkalian pengekalan yang sesuai dan ramalan model telah disimpan dalam Zenodo (https://zenodo.org/record/6602698) (73), (https://zenodo.org/record/6988696) (74). Masa bacaan tanpa nama, data pengeluaran bahasa dan kod sumber telah disimpan dalam GitLab (https://gitlab.com/ m-hahn/resource-rational-surprisal) (75).

PENGHARGAAN. Kami berterima kasih kepada editor dan pengulas atas maklum balas membina mereka, yang membantu menambah baik manuskrip. Kami juga berterima kasih kepada Judith Degen, Tiwalayo Eisape, Hailin Hao, Jennifer Hu, Dan Jurafsky, PengQian, Cory Shain, Shravan Vasishth, Tom Wasow, Ethan Wilcox, dan penonton di Persidangan CUNY 2020 tentang Pemprosesan Ayat untuk perbincangan dan maklum balas yang berguna.

improve memory


Rujukan

1. N. Chomsky, Struktur Sintaksis (Mouton, The Hague, 1957).

2. GA Miller, N. Chomsky, "Model akhir pengguna bahasa" dalam Handbook of MathematicalPsychology, RD Luce, RR Bush, G. Galanter, Eds. (John Wiley, 1963), hlm. 269–321.

3. L. Frazier, "Kerumitan sintaksis" dalam Penghuraian Bahasa Semulajadi: Perspektif Psikologi, Pengiraan dan Teori, DR Dowty, L. Karttunen, AM Zwicky, Eds. (Cambridge University Press, NewYork, 1985), hlm. 129–189.
4. E. Gibson, Kerumitan linguistik: Lokaliti kebergantungan sintaksis. Kognisi 68, 1–76 (1998).

5. B. McElree, S. Foraker, L. Dyer, Struktur ingatan yang mengikut kefahaman ayat.J. Mem.Lang. 48, 67–91 (2003).

6. W. Tabor, B. Galantucci, DC Richardson, Kesan koheren sintaksis tempatan semata-mata pada pemprosesan ayat.J. Mem. Lang. 50, 355–370 (2004).

7. RL Lewis, S. Vasishth, Model pemprosesan ayat berasaskan pengaktifan sebagai perolehan ingatan mahir.Cogn. Sci. 29, 375–419 (2005).

8. MH Christiansen, MC MacDonald, Pendekatan berasaskan penggunaan untuk rekursi dalam pemprosesan ayat.Lang. Belajar. 59, 126–161 (2009).

9. J. Hale, (2001) "A probabilistik early parser as a psycholinguistic model" dalam Prosiding Mesyuarat Kedua Bab Amerika Utara bagi Persatuan Linguistik Pengiraan, NAACL 2001,L. Levin, K. Knight, Eds. (Persatuan untuk Linguistik Pengiraan, Stroudsburg, PA), ms 1–8.

10. R. Levy, Kefahaman sintaksis berasaskan jangkaan. Kognisi 106, 1126–1177 (2008).

11. K. Rayner, AD Well, Kesan kekangan kontekstual pada pergerakan mata dalam membaca: Satu pemeriksaan lanjut. Psychon. lembu jantan. Wahyu 3, 504–509 (1996).

12. A. Staub, Kesan kebolehramalan leksikal pada pergerakan mata dalam membaca: Kajian kritis dan tafsiran teori.Lang. Ahli bahasa. Kompas 9, 311–327 (2015).


For more information:1950477648nn@gmail.com



Anda mungkin juga berminat