> A http://hix.hu/ziBuw-mokk.bme.hu oldalon szereplő alábbi szöveg
> fordítására lenne szükségem.
Csak a 4%-os küszöbkorpuszt tesszük letölthet?vé (a többi kérésre
hozzáférhet?), mert már ez a 589 millió szó 1221 millió magyar
weboldalról, és még zippelt formátumban is 4 GB. Tíz, majdnem
egyforma, de független részben tesszük közzé, mindet egy tar.gz
file-ban.
A szükséges korpusz méretét?l függ?en töltsön le egy vagy több
file-t és csomagolja ki ugyanabba a mappába. A dokumentumok különböz?
file-okként csomagolódnak ki a content/ mappába, mindegyik szavakra és
mondatokra bontva, nyers XML formátumban (az & jeleket nem kódoltuk).
Láng Attila D., író, Láng Krisztina +, http://lattilad.org
|