Po Narodowym Korpusie Języka Polskiego — zmiany w słownictwie polskim ostatniej dekady na przykładzie słów kluczowych


Abstrakt

Artykuł przedstawia wyniki analizy zmian w słownictwie polskim na przestrzeni ostatniego dziesięciolecia. Badanie przeprowadzono na podstawie porównania dwu zróżnicowanych, wielomilionowych korpusów (obejmujących lata 2011–2022) z podzbiorem zrównoważonego Narodowego Korpusu Języka Polskiego (okres do 2010 r.), przy wykorzystaniu metody słów kluczowych, polegającej na automatycznej ekstrakcji z tekstów słów szczególnie dla nich charakterystycznych. Pozwoliło to na wyodrębnienie najsilniejszych trendów leksykalnych, które odróżniają język ostatniej dekady od tego zarejestrowanego w NKJP i wskazują na istotne zmiany pozajęzykowe o charakterze społecznym, ekonomicznym, politycznym itd. 

Słowa kluczowe

lingwistyka korpusowa; Narodowy Korpus Języka Polskiego; zmiany językowe; badania diachroniczne; słowa kluczowe

Baker, P., McEnery, T. 2019. The value of revisiting and extending previous studies: the case of Islam in the UK press. W: Quantifying approaches to discourse for social scientists, red. R. Scholz, s. 215–249. Basingstoke: Palgrave Macmillan.
Cierpich-Kozieł, A. 2022. O patocelebrytach i patointeligencji, czyli o nowych złożeniach z (produktywnym) członem pato-. Język Polski.
Clarke, I., Brookes, G., McEnery, T. 2022. Keywords through time. Tracking changes in press discourses of Islam. International Journal of Corpus Linguistics 27(4), s. 399–427.
Csomay, E., Young, R. 2020. Language use in pop culture over three decades: a diachronic keyword analysis of Star Trek dialogues. International Journal of Corpus Linguistics 26(1), s. 71–94.
Davies, M. 2008-. The Corpus of Contemporary American English (COCA). Online: https://www.english-corpora.org/coca/ [dostęp 21.11.2022].
Egbert, J., Biber, D. 2019. Incorporating text dispersion into keyword analyses. Corpora 14(1), s. 77–104.
Kilgarriff, A. 2012. Getting to know your corpus. W: International Conference on Text, Speech and Dialogue, s. 3–15. Berlin, Heidelberg: Springer.
Krasowska, D. 2018. Ekspresywne nazwy osób w języku licealistów i studentów białostockich. Białostockie Archiwum Językowe 18, s. 99–114.
Křen, M. 2015. Recent developments in the Czech National Corpus. W: Proceedings of the 3rd workshop on challenges in the management of large corpora (CMLC-3), red. Bański, P., Biber, H., Breiteneder, E., Kupietz, M., Lüngen, H., Witt, A., s. 1–4. Mannheim: Institut für Deutsche Sprache.
Lee, L. H., Braud, T., Zhou, P., Wang, L., Xu, D., Lin, Z., Kumar, A., Bermejo, C., Hui, P. 2021. All one needs to know about metaverse: a complete survey on technological singularity, virtual ecosystem, and research agenda. Journal of LaTeX Class Files 14(8), s. 1-66.
Mańczak-Wohlfeld, E. 2006. Angielsko-polskie kontakty językowe. Kraków: Wydawnictwo Uniwersytetu Jagiellońskiego.
Mańczak-Wohlfeld, E. (red.) 2010. Słownik zapożyczeń angielskich w polszczyźnie. Warszawa: Wydawnictwo Naukowe PWN.
McEnery, T., Baker, H. 2016. Corpus linguistics and 17th-century prostitution: computational linguistics and history. Londyn: Bloomsbury Academic.
McEnery, T., R. Xiao, Tono, Y. 2006. Corpus-based language studies: an advanced resource book. Londyn, Nowy Jork: Routledge.
Open Research 2022. Badanie świadomości ekologicznej Polaków/ segmentacja.
Partington, A. 2010. Modern Diachronic Corpus-Assisted Discourse Studies (MD-CADS) on UK newspapers: An overview of the project. Corpora 5(2), s. 83–108.
Paryzek, P. 2011. Pozyskiwanie danych leksykalnych z tekstów elektronicznych (na materiale czasopisma naukowego). Poznań: UAM. Praca doktorska.
Przepiórkowski, A., Bańko, M., Górski, R. L., Lewandowska-Tomaszczyk, B. red. 2012. Narodowy Korpus Języka Polskiego. Warszawa: Wydawnictwo Naukowe PWN.
Scott, M. 1997. PC analysis of key words – and key key words. System 25(2), s. 233–245.
Scott, M. 2010. Problems in investigating keyness, or clearing the undergrowth and marking out trails… W: Keyness in Texts, red. M. Bondi, M. Scott, s. 1–12. Londyn: Continuum.
Seetharaman, A., Saravanan, A. S., Patwa, N., Mehta, J. 2017. Impact of Bitcoin as a world currency. Accounting and Finance Research 6(2), s. 230-246.
Siuciak, M. 2015. Ciągłość i zmienność jako problem badań diachronicznych. LingVaria X 2(20), s. 149–159.
Stubbs, M. 2004. Language corpora. W: Handbook of applied linguistics, red. A. Davies, E. Catherine, s. 106-132. Oxford: Blackwell.
Waszakowa, K. 2005. Przejawy internacjonalizacji w słowotwórstwie współczesnej polszczyzny. Warszawa: Wydawnictwa Uniwersytetu Warszawskiego.
Wawrzyńczyk, J. 2011. Słownictwo nowopolskie. Redatacje. Warszawa: BEL Studio.
Zemlanaja, N. 2016. Fighter, hejter i headliner, czyli o wyrażeniach pochodzenia angielskiego we współczesnej polszczyźnie. W: Globalizacja a przemiany języków słowiańskich, red. H. Kurek, M. Święcicka, M. Peplińska, s. 354–368. Bydgoszcz: Wydawnictwo UKW.
Pobierz

Opublikowane : 2023-06-04



Natalia Zawadzka-Paluektau 
Instytut Podstaw Informatyki Polskiej Akademii Nauk  Polska
http://orcid.org/0000-0003-4969-2039
Aleksandra Tomaszewska 
Instytut Podstaw Informatyki Polskiej Akademii Nauk  Polska
http://orcid.org/0000-0001-6379-3034
Joanna Wołoszyn 
Instytut Podstaw Informatyki Polskiej Akademii Nauk  Polska
http://orcid.org/0000-0002-8923-414X