Filozofski fakultet

Knjižnica

Gdje se nalazimo

Tajništvo

Članovi Odsjeka

Impressum

Jezični inženjering PDF Ispis
Četvrtak, 17 Rujan 2009 12:11

Naziv kolegija: Jezični inženjering

Nastavnik: doc. dr. sc. Nives Mikelić Preradović

ECTS-bodovi: 6

Jezik: hrvatski

Trajanje: 1 semestar

Status: obvezan za jednopredmetni studij, izborni za dvopredmetni studij

Oblik nastave: 1 sat predavanja, 1 sat seminara i 2 sata vježbi

Uvjeti: položen kolegij Uvod u obradu prirodnog jezika

Ispit: pismeni


Sadržaj:
Obrada prirodnog jezika automatska je analiza ljudskog jezika od strane računalnih algoritama. Koristi se za pretvorbu jednog jezičnog oblika u drugi, ali i za parsiranje jezika u strukturirani oblik. Pretvorba jezika uključuje sažimanje, parafraziranje ili prevođenje jezika, dok parsiranje obuhvaća pretvaranje nestrukturiranih podataka u strukturirani oblik. Teme obuhvaćaju: jezični inženjering u kontekstu inteligentnih sustava - dijaloški sustavi, sve razine jezičnog znanja, izradu valencijskog leksikona glagola i imenica utemeljenog na sintaktičkim i semantičkim obilježjima glagola te strojno prevođenje.


Cilj – opće i specifične kompetencije:

Studenti će steći teoretsko i praktično znanje u oblikovanju jezičnog resursa. Tijekom semestra će raditi na projektu izrade valencijskog leksikona glagola i imenica za hrvatski jezik, na kojem će moći:

a) prepoznati značajke koje razlikuju sustave prirodnog jezika od ostalih inteligentnih sustava;

b) pokazati detaljno poznavanje pristupa izradi jezičnog resursa za hrvatski jezik

c) upoznati razliku u sintaktičkom i semantičkom pristupu klasifikaciji i opisu glagola u valencijskom leksikonu za različite prirodne jezike

d) vrednovati postojeće sustave za različite prirodne jezike

 


Sadržaj kolegija (podjela po tjednima):

  1. Uvodno predavanje. Opis kolegija i uvjeti.
  2. Pregled područja i ciljevi.
  3. Leksikoni i naglasno-morfoloski generatori
  4. CROVALLEX- valencijski leksikon glagola hrvatskog jezika_I.
  5. CROVALLEX- valencijski leksikon glagola hrvatskog jezika_II.
  6. Leksička semantika - Case for Case (Fillmore)
  7. Leksička semantika - FrameNet
  8. Leksičke konceptualne strukture - Jackendoff
  9. Valencije imenica i pridjeva.
  10. Strojno prevođenje - pregled od početaka do danas
  11. Strojno prevođenje-pristup utemeljen na pravilima.
  12. Strojno prevođenje- statistički pristup.
  13. Dijaloski sustavi 1.
  14. Dijaloski sustavi 2.
  15. NLU - razumijevanje prirodnog jezika


Osnovna literatura:

1. Mikelić Preradović, N. Pristupi izradi strojnog tezaurusa za hrvatski jezik: doktorska disertacija. Zagreb.

2. Mikelić Preradović, Nives. Semantic classification of verbs in CROVALLEX // RECENT ADVANCES in COMPUTER ENGINEERING and APPLICATIONS. Proceedings of the 4th WSEAS International Conference on COMPUTER ENGINEERING and APPLICATIONS (CEA '10). / Lagakos, Stephen ; Perlovsky, Leonid ; Jha, Manoj ; Covaci, Brindusa ; Zaharim, Azama ; Mastorakis, Nikos (ur.). Harvard University, Cambridge, USA : WSEAS Press, 2010. Str. 53-59.

3.Daniel Jurafsky & James. H. Martin. Speech and Language Processing: An Introduction to Natural Language Processing, Prentice Hall, NJ, 2000.

Dopunska:

1. Copestake, Ann. Analysing Sentences, Noel Burton-Roberts, Longman, 1997.

2. Allen, James. Natural Language Understanding. Redwood, CA: Benjamin, 1995.

3. Marko Tadić i Božo Bekavac. Preparation of POS tagging of Croatian using CLaRK System. Proceedings of RANLP2003 Conference (Borovets 2003), Bugarska akademija znanosti, str. 455-459

4. Marko Tadić i Krešimir Šojat. Finding Multiword Term Candidates in Croatian. Proceedings of RANLP2003 Conference (Borovets 2003), Bugarska akademija znanosti, str. 102-107

5. Evans, Roger; and Gerald Gazdar. DATR: a Language for Lexical Knowledge Representation. Computational Linguistics 22 (2).167-216.

6. Pinker, Steven. The Language Instinct. London: Penguin, 1994.

7. Marko Tadić. Jezične tehnologije i hrvatski jezik. Exlibris, Zagreb 2003.

Ažurirano Utorak, 16 Ožujak 2010 18:16