Informazioa ateratze

Wikipedia(e)tik

Informazioa ateratzea (ingelesez, Information Extraction edo IE) informazioa eskuratzeko modu bat da, ordenagailu batek irakur ditzakeen dokumentuetatik informazio egituratu edo erdi-egituratua ateratzea helburu duena.

Informazioa ateratzeko ohiko aplikazio bat lengoaia naturalean idatzitako dokumentu sorta bat eskaneatu eta ateratako informazioa datu-base sartzen duena da. Gaur egun lengoaia naturalen prozesamendurako teknikak erabiltzen dira. Adibidez, Message Understanding Conference (MUC) edo Mezuak Ulertzeko Hitzaldia honako aspektu hauetan aritu den lehiaketa da:

  • MUC-1 1987, MUC-2 1989: Ontzi-eragiketentzako mezuak.
  • MUC-3 1991: Latinamerikar herrialdeetako terrorismoa.
  • MUC-5 1993: Mikroelektronika.
  • MUC-6 1995: Gerentzia aldaketen inguruko artikulu berriak.
  • MUC-7 1998: Sateliteen jaurtiketen txostenak.

[aldatu] Ikus, gainera

Beste hizkuntzak