{"id":9892,"date":"2023-12-05T14:11:53","date_gmt":"2023-12-05T13:11:53","guid":{"rendered":"https:\/\/dev.test-wpo.pl\/?post_type=projekty-nib&#038;p=9892"},"modified":"2023-12-05T14:11:53","modified_gmt":"2023-12-05T13:11:53","slug":"jezyk-mieszkancow-spisza-korpus-tekstow-i-nagran-gwarowych","status":"publish","type":"projekty-nib","link":"https:\/\/ijppan.pl\/en\/projekty-nib\/jezyk-mieszkancow-spisza-korpus-tekstow-i-nagran-gwarowych\/","title":{"rendered":"J\u0118ZYK MIESZKA\u0143C\u00d3W SPISZA. KORPUS TEKST\u00d3W I NAGRA\u0143 GWAROWYCH"},"content":{"rendered":"<p><strong>Kierownik:<\/strong> dr hab. Helena Grochola-Szczepanek, prof. IJP PAN<br \/>\n<strong>Wykonawcy:<\/strong> dr hab. Rafa\u0142 L. G\u00f3rski, prof. IJP PAN, mgr Beata Heller, mgr Magdalena Hojniak, mgr Marta Jasiczek, mgr Ilona Kulak, mgr Mariola Milaniak, mgr Monika Milaniak, mgr Krystian Pilch, mgr Szymon Pogwizd, mgr Barbara Pukalska, prof. Ruprecht von Waldenfels, dr Micha\u0142 Wo\u017aniak<\/p>\n<p><strong>Numer projektu:<\/strong> 1bH 15 0166 83<br \/>\n<strong>Data rozpocz\u0119cia:<\/strong> 23.09.2015<br \/>\n<strong>Data zako\u0144czenia:<\/strong> 22.03.2019<br \/>\n<strong>Jednostka finansuj\u0105ca:<\/strong> MNiSW w ramach NPRH<\/p>\n<h2>KONTEKST PROJEKTU<\/h2>\n<p>W Instytucie J\u0119zyka Polskiego PAN w Krakowie powstaje pierwszy korpus j\u0119zyka m\u00f3wionego mieszka\u0144c\u00f3w wsi w Polsce. Opracowanie regionalnej odmiany j\u0119zyka w formie elektronicznej bazy jest pionierskim przedsi\u0119wzi\u0119ciem w polskiej humanistyce oraz jednym z pierwszych \u2014 w ca\u0142ej s\u0142owia\u0144szczy\u017anie.<br \/>\nProjekt ma na celu zbudowanie bazy tekst\u00f3w i nagra\u0144 z regionu Spisza oraz opracowanie narz\u0119dzi do dokonywania wysublimowanych operacji na tym korpusie (wyszukiwanie, filtrowanie, tworzenie zestawie\u0144 statystycznych itp.).<br \/>\nProjekt ma charakter heterogeniczny, jego celem jest unowocze\u015bnienie metod bada\u0144 dialektologicznych oraz w\u0142\u0105czanie ich w nurt j\u0119zykoznawstwa korpusowego. Oryginaln\u0105 mow\u0119 mieszka\u0144c\u00f3w wsi b\u0119dzie mo\u017cna obserwowa\u0107 nie tylko w zapisie, ale tak\u017ce s\u0142ysze\u0107 jej brzmienie. Wyszukiwarka pozwoli na przeszukiwanie tekst\u00f3w wed\u0142ug rozlicznych kryteri\u00f3w, m.in.: lemat\u00f3w, postaci tekstowej, okre\u015blonych form gramatycznych, metadanych (miejscowo\u015b\u0107, wiek, p\u0142e\u0107, zaw\u00f3d, pobyt poza wsi\u0105 informatora) oraz koresponduj\u0105cego fragmentu nagrania. Wyszukiwarka b\u0119dzie obs\u0142ugiwa\u0142a tak\u017ce bardziej zaawansowane techniki, jak np. \u0142\u0105czenie kryteri\u00f3w, wyszukiwanie z pomoc\u0105 wyra\u017ce\u0144 regularnych, negacj\u0119 element\u00f3w zapytania.<\/p>\n<h2>OPIS PROJEKTU<\/h2>\n<p>Praca nad tworzeniem korpusu j\u0119zyka m\u00f3wionego jest wieloetapowa i obejmuje r\u00f3\u017cnorodne obszary dzia\u0142a\u0144, takie jak:<\/p>\n<ol>\n<li>Badania terenowe na polskim Spiszu;<\/li>\n<li>Transkrypcja materia\u0142\u00f3w w postaci zdigitalizowanej;<\/li>\n<li>Anotacja otrzymanych tekst\u00f3w (lematyzacja i znakowanie morfosyntaktyczne);<\/li>\n<li>Opracowanie s\u0142ownictwa typowo gwarowego, dyferencyjnego;<\/li>\n<li>Opracowanie bazy danych oraz interfejsu graficznego.<\/li>\n<\/ol>\n<p>Podstaw\u0105 materia\u0142ow\u0105 bazy s\u0105 aktualnie prowadzone wywiady z mieszka\u0144cami wsi spiskich. Do transkrypcji tekst\u00f3w w postaci cyfrowej wykorzystujemy narz\u0119dzie ELAN, pozwalaj\u0105ce na \u0142\u0105czenie warstwy tekstowej i d\u017awi\u0119kowej. Nast\u0119pnie materia\u0142y s\u0105 rozszerzane o warstw\u0119 anotacji j\u0119zykoznawczej. Wypracowywane s\u0105 rozwi\u0105zania metodologiczne dla kodu niestandardowego, m.in. zasady transkrypcji, klasyfikacja leksem\u00f3w, wzorce odmiany gwarowej.<br \/>\nSzczeg\u00f3lnie pracoch\u0142onnym etapem s\u0105 transkrypcje nagra\u0144 oraz znakowanie r\u0119czne wyraz\u00f3w charakterystycznych tylko dla gwary. Wiele pracy zajmuje tak\u017ce dostosowanie istniej\u0105cych narz\u0119dzi informatycznych (stworzonych dla odmiany og\u00f3lnej j\u0119zyka polskiego) do systemu gramatycznego gwary spiskiej.<br \/>\nWypracowanie metodologii pracy z materia\u0142ami gwarowymi oraz rozbudowanie i przetestowanie narz\u0119dzi informatycznych, kt\u00f3re do tej pory mia\u0142y zastosowanie tylko w zakresie polszczyzny og\u00f3lnej, b\u0119dzie bardzo wa\u017cnym krokiem w rozwoju dialektologicznych prac korpusowych w Polsce.<\/p>\n<h2>WYKAZ PUBLIKACJI ZWI\u0104ZANYCH Z PROJEKTEM<\/h2>\n<ol>\n<li>Grochola-Szczepanek H., Wo\u017aniak M., Transkrypcja j\u0119zyka mieszka\u0144c\u00f3w wsi w aplikacji ELAN w <em>Korpusie Spiskim<\/em>, 2018 (w druku).<\/li>\n<li>Kulak I., Korpus spiskich tekst\u00f3w i nagra\u0144 gwarowych. Za\u0142o\u017cenia projektowanej bazy i mo\u017cliwo\u015bci jej wykorzystania jako \u017ar\u00f3d\u0142a bada\u0144 interdyscyplinarnych, Prace Etnograficzne, 2018, t. 46\/1, s. 30-49.<\/li>\n<li>Grochola-Szczepanek H., Nowe badania j\u0119zyka mieszka\u0144c\u00f3w wsi regionu polskiego Spisza, [w:] J\u0119zyk w regionie \u2013 region w j\u0119zyku 2, Pozna\u0144skie Studia Polonistyczne 47, Pozna\u0144 2017, s.103-119.<\/li>\n<li>Waldenfels R. von, Wo\u017aniak M., SpoCo \u2013 a simple and adaptable web interface for dialect corpora, Journal for Language Technology and Computational Linguistics, 2016, vol. 31, pp. 155-170.<\/li>\n<li>Grochola-Szczepanek H., Korpusowe badania j\u0119zyka mieszka\u0144c\u00f3w Spisza w Polsce \u2013 cele i zadania, Jezikoslovni zapiski, In\u0161titut za slovenski jazik Frana Ramov\u0161a ZRC SAZU, 2016, s. 185-196.<\/li>\n<\/ol>\n<h2>PRZYDATNE STRONY INTERNETOWE<\/h2>\n<p>Strona projektu: <a href=\"https:\/\/spisz.ijppan.pl\/\">https:\/\/spisz.ijppan.pl\/<\/a> z dost\u0119pn\u0105 wersj\u0105 demonstracyjn\u0105 korpusu przez logowanie. Osoby zainteresowane prosimy o kontakt <span id=\"wpmt-132371-460881\"><span  class=\"protected_mail\">            <span id=\"protected_mail_69d3749edc69e\"><\/span>\n                    <span id=\"protected_mail_69d3749edc6a0\"><\/span>\n                    <span id=\"protected_mail_69d3749edc6a1\"><\/span>\n                    <span id=\"protected_mail_69d3749edc6a2\"><\/span>\n                    <span id=\"protected_mail_69d3749edc6a3\"><\/span>\n                    <span id=\"protected_mail_69d3749edc6a4\"><\/span>\n                    <span id=\"protected_mail_69d3749edc6a5\"><\/span>\n                    <span id=\"protected_mail_69d3749edc6a6\"><\/span>\n                    <span id=\"protected_mail_69d3749edc6a7\"><\/span>\n                    <span id=\"protected_mail_69d3749edc6a8\"><\/span>\n                    <span id=\"protected_mail_69d3749edc6a9\"><\/span>\n                    <span id=\"protected_mail_69d3749edc6aa\"><\/span>\n                    <span id=\"protected_mail_69d3749edc6ab\"><\/span>\n                    <span id=\"protected_mail_69d3749edc6ac\"><\/span>\n                    <span id=\"protected_mail_69d3749edc6ad\"><\/span>\n        <\/span>    <style>\n        .protected_mail span#protected_mail_69d3749edc69e::after{ content: \"s\"}.protected_mail span#protected_mail_69d3749edc6a0::after{ content: \"p\"}.protected_mail span#protected_mail_69d3749edc6a1::after{ content: \"i\"}.protected_mail span#protected_mail_69d3749edc6a2::after{ content: \"s\"}.protected_mail span#protected_mail_69d3749edc6a3::after{ content: \"z\"}.protected_mail span#protected_mail_69d3749edc6a4::after{ content: \"@\"}.protected_mail span#protected_mail_69d3749edc6a5::after{ content: \"i\"}.protected_mail span#protected_mail_69d3749edc6a6::after{ content: \"j\"}.protected_mail span#protected_mail_69d3749edc6a7::after{ content: \"p\"}.protected_mail span#protected_mail_69d3749edc6a8::after{ content: \"p\"}.protected_mail span#protected_mail_69d3749edc6a9::after{ content: \"a\"}.protected_mail span#protected_mail_69d3749edc6aa::after{ content: \"n\"}.protected_mail span#protected_mail_69d3749edc6ab::after{ content: \".\"}.protected_mail span#protected_mail_69d3749edc6ac::after{ content: \"p\"}.protected_mail span#protected_mail_69d3749edc6ad::after{ content: \"l\"}    <\/style>\n    <\/span><script type=\"text\/javascript\">document.getElementById(\"wpmt-132371-460881\").innerHTML = eval(decodeURIComponent(\"%27%73%70%69%73%7a%40%69%6a%70%2e%70%61%6e%2e%70%6c%27\"))<\/script><noscript>*protected email*<\/noscript><\/p>\n<p>Facebook: <a href=\"https:\/\/www.facebook.com\/ijp.krakow.pan\/\">https:\/\/www.facebook.com\/ijp.krakow.pan\/<\/a><\/p>\n","protected":false},"featured_media":0,"template":"","projekty":[24,23],"class_list":["post-9892","projekty-nib","type-projekty-nib","status-publish","hentry","projekty-projekty","projekty-projekty-zrealizowane"],"acf":[],"_links":{"self":[{"href":"https:\/\/ijppan.pl\/en\/wp-json\/wp\/v2\/projekty-nib\/9892","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/ijppan.pl\/en\/wp-json\/wp\/v2\/projekty-nib"}],"about":[{"href":"https:\/\/ijppan.pl\/en\/wp-json\/wp\/v2\/types\/projekty-nib"}],"wp:attachment":[{"href":"https:\/\/ijppan.pl\/en\/wp-json\/wp\/v2\/media?parent=9892"}],"wp:term":[{"taxonomy":"projekty","embeddable":true,"href":"https:\/\/ijppan.pl\/en\/wp-json\/wp\/v2\/projekty?post=9892"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}