2.6 Líonra Séimeantach na Gaeilge (LSG)

Tá tionscadal Líonra Séimeantach na Gaeilge faoi stiúir Kevin Scannell, Ollscoil St. Louis, SAM. Baineadh leas as a leathanaigh ar Líonra Séimeantach na Gaeilge atá ar fáil ag http://borel.slu.edu/lsg/index.html mar phríomhfhoinse eolais don tráchtas seo agus taighde á dhéanamh ar an tionscadal.

Meiriceánach is ea Scannell a rugadh i mBostún, Massachusetts i 1970. Éireannaigh ab ea a sheantuismitheoirí ar an dá thaobh, agus dá bharr sin bhí cultúr na hÉireann an-tábhachtach dá mhuintir nuair a bhí sé óg. Tá sé ina ollamh le matamaitic agus ríomheolaíocht in Ollscoil Saint Louis, Missouri ó 1998 agus ceapadh é mar Stiúrthóir Ríomheolaíochta na hOllscoile in 2006. Tá cuid mhór taighde déanta aige ar chúrsaí ríomhtheangeolaíochta i dteangacha éagsúla agus sa Ghaeilge go háirithe. Tá Scannell ag comhoibriú le foireann Fhoras na Gaeilge i dtionscadal an Fhoclóra Nua Béarla-Gaeilge, agus tá córas nua ríomhaistriúcháin Béarla go Gaeilge ar na bacáin aige agus é ag súil go mbeidh sé críochnaithe faoi dheireadh 2012.

Tá acmhainní teanga á bhforbairt ag Scannell ar son mionteangacha ar fud an domhain, go háirithe na teangacha Ceilteacha eile, teangacha Bantúcha san Afraic agus teangacha Polainéiseacha. Deir sé:

‘Creidim go láidir gur féidir an-tairbhe a bhaint as an teicneolaíocht agus as an nGréasán le mionteangacha a chosaint agus a chur chun cinn – agus seo é bunús m’oibre go léir’.[1]

Tá Líonra Séimeantach na Gaeilge bunaithe ar bhunachar sonraí léacsach atá inléite ag meaisín agus atá múnlaithe ar Wordnet®. Is bunachar sonraí cuimsitheach é ina bhfuil timpeall is 36,262 ceannfhocal ann faoi láthair, téarmaíocht chomhaimseartha, focail liteartha, focail chanúnacha, béarlagair, etc. san áireamh. Thosaigh tionscadal LSG in 2002 nuair a chruthaigh Kevin Scannell teasáras simplí Gaeilge, bunaithe ar Theasáras Roget atá ar fáil saor in aisce ó Project Gutenberg. Labhair sé ar an obair sin ag an gcomhdháil TALN 2003 sa pháipéar a thug sé Automatic thesaurus generation for minority languages: an Irish example. (Scannell, 2003). Ach níor scaipeadh an chéad teasáras go forleathan, mar mheas sé go bhféadfadh sé feabhas mór a chur air.

Tá sé beartaithe ag Scannell Líonra Séimeantach na Gaeilge a fhorbairt níos críochnúla mar uirlis shéimeantach agus teastaíonn uaidh sainmhínithe agus samplaí úsáide a chur leis na ceannfhocail. Dúirt sé nuair a bhí LSG á mhapáil aige le Princeton Wordnet®, chonaic sé go raibh foclóir Gaeilge-Gaeilge beagnach ann chomh maith, an príomhrud a bhí in easnamh ann ná sainmhínithe ar na ceannfhocail.

Is é an seift atá aige na gluaiseanna Béarla atá in Wordnet® cheana féin a aistriú go Gaeilge dá gceannfhocail chuí in LSG. Deir Scannell go mbeadh thart ar 320,000 focal Béarla le haistriú chun obair ar na gluaiseanna a thabhairt chun críche. Ansin bhainfí úsáid as Corpas Comhthreomhar na Gaeilge chun samplaí úsáide a aimsiú go huathoibríoch, agus bheadh próiseas seiceála de láimh ar na habairtíní samplacha ansin. Dá n-éireodh le pleananna Scannell, bheadh comhghléas ina mbeadh foclóir agus teasáras leictreonach Gaeilge-Gaeilge araon curtha ar fáil don phobal saor in aisce.

Tá an obair ag brath ar a obair dheonach féin agus ar obair dheonach ó chúntóirí a bhfuil suim acu ann. Meitheal oibre atá i gceist go dtí gur féidir maoiniú a fháil a chabhródh le foireann aistritheoirí a earcú. Tá taithí mhaith ag Scannell cheana féin sa chur chuige ‘sluafhoinsithe’ i dtionscadail aistriúcháin. Is eisean atá i gceannas ar an bhfoireann dheonach a chuireann leagan Gaeilge ar a lán bogearraí foinse oscailte – Open Office, Mozilla Firefox ina measc. Maidir le Líonra Séimeantach na Gaeilge, tá creatlach na hoibre don aistriúchán ar na gluaiseanna Béarla á thástáil aige faoi láthair, agus tá an taighdeoir páirteach sa phróiseas tástála mar chuid den tráchtas seo.

Creideann Scannell go dteastaíonn foclóir mór aonteangach gó géar ó fhoghlaimeoirí agus ó scríbhneoirí na Gaeilge agus gur féidir é a dhéanamh laistigh de thréimhse ama sách gearr trí fhorbairt a dhéanamh ar LSG agus sainmhínithe Gaeilge a chur ar na ceannfhocail.


[1] http://borel.slu.edu/gaeilge.html

Advertisements

Freagra

Líon amach do chuid faisnéise thíos nó cliceáil ar dheilbhín le logáil isteach:

Lógó WordPress.com

Is le do chuntas WordPress.com atá tú ag freagairt. Logáil Amach / Athrú )

Peictiúr Twitter

Is le do chuntas Twitter atá tú ag freagairt. Logáil Amach / Athrú )

Pictiúr Facebook

Is le do chuntas Facebook atá tú ag freagairt. Logáil Amach / Athrú )

Pictiúr Google+

Is le do chuntas Google+ atá tú ag freagairt. Logáil Amach / Athrú )

Ceangal le %s