Politics.be

Politics.be (https://forum.politics.be/index.php)
-   Suggesties & Mededelingen (https://forum.politics.be/forumdisplay.php?f=20)
-   -   Nederlandse Taalunie wil dit forum gebruiken voor wetenschappelijke doeleinden (https://forum.politics.be/showthread.php?t=103625)

Maarten Malaise 29 maart 2008 13:30

Nederlandse Taalunie wil dit forum gebruiken voor wetenschappelijke doeleinden
 
Wat vinden jullie hiervan: Het forum van Politics.be als basis voor wetenschappelijk onderzoek. Er worden 100 miljoen woorden gezocht die in hun eigen verband moeten staan voor de aanmaak van een referentiecorpus waarin het Vlaams goed vertegenwoordigd wordt. Forum is volgens mij al goed voor meer dan 50 miljoen woorden.

Ik vind het een hele eer.

Citaat:

Betreft: tekstmateriaal voor aanmaak Nederlandstalig referentiecorpus voor
onderzoeksdoeleinden

28-03-2008
Geachte heren Viaene en Malaise,

Als partner van een consortium (Hogent, Universiteit Nijmegen, Universiteit
Twente, Universiteit Tilburg) werken we aan het project Stevin
Nederlandstalig Referentiecorpus (SoNaR), waarin we een referentiecorpus
geschreven Nederlands van 100 miljoen. woorden opbouwen voor het
Nederlandstalig gebied (Nederland en Vlaanderen). Heel belangrijk voor dat
project is dat Vlaamse data in het corpus evenredig vertegenwoordigd zou
zijn. Meer informatie over het project kunt vinden op
http://lands.let.ru.nl/projects/SoNaR/home.html.

Het project wordt gefinancierd door het STEVIN-programma van de Nederlandse
Taalunie die de ontwikkeling van de digitale infrastructuur voor het
Nederlands moet bevorderen om de positie van het Nederlands in de moderne
informatie- en communicatiewereld te versterken. STEVIN staat voor Spraak-
en Taaltechnologische Essentiële Voorzieningen In het Nederlands. Meer
informatie vindt u op de STEVIN-website:
http://taalunieversum.org/taal/technologie/stevin/ en in de bijgesloten
flyer.

Voor ons project zijn we op zoek naar Nederlandstalig tekstmateriaal in
elektronische vorm, de teksten kunnen zowel origineel geschreven zijn in het
Nederlands als vertalingen zijn vanuit vreemde talen in het Nederlands.

Binnen het corpus proberen we een zo rijk mogelijke diversiteit aan teksten
bijeen te brengen uit verschillende domeinen, o.a. discussies op
internetfora.

Als Politics.be kunt u ons wellicht verder helpen en zou u een hoogst
welkome inbreng kunnen hebben als tekstleverancier van dit soort data.
Daarbij denken we hoofdzakelijk aan teksten die aanwezig zijn op uw site:
http://forum.politics.be/, zowel de stellingen als de reacties erop.

Tijdens verdere contacten kunnen we de leveringsvoorwaarden en
auteursrechten bespreken. De actualiteitswaarde van de tekst is niet
belangrijk. Evenmin hebben wij de integrale tekst nodig, fragmenten zijn ook
bruikbaar.

Daarnaast zouden we de toestemming moeten krijgen om het verworven
tekstmateriaal openbaar te mogen maken voor onderzoeksdoeleinden. Het corpus
zal o.a. ingezet worden voor onderzoek binnen taaltechnologie en -onderzoek,
taalkunde en taaldidactiek.

Indien u meer informatie wenst over het project, kan u altijd contact
opnemen met Lidia Rura ([email protected]).

Wij hopen dat wij mogen rekenen op uw hulp. Met de meeste hoogachting

Namens het projectteam

L.R.
Language and Translation Technology Team
Departement Vertaalkunde
Hogeschool Gent
Maarten

Jazeker 29 maart 2008 13:40

Het is inderdaad een hele eer voor het forum.

(tussen haakjes: ik vraag 10 cent per woord...)

nero1 29 maart 2008 13:45

Niets op tegen... als ze bereid zijn een deel van de kosten van het forum te dragen :lol:

Citaat:

Het programma STEVIN is officieel van start gegaan op 15 september 2004 en loopt tot eind 2010. Het totaalbudget voor dit programma bedraagt 11,4 miljoen euro en wordt gezamenlijk gedragen door de Vlaamse en de Nederlandse overheden.

Kay_ 29 maart 2008 13:50

Dit hoort wel niet bij binnenlandse, hé. Foei! :-)

Maar al bij al, inderdaad toch wel een eer.

Den Ardennees 29 maart 2008 14:00

we gaan dus op onze taal moeten letten

(in het auditorium, ik zie het zo al voor me: "forumlid Eric Feremans is een schoolvoorbeeld hoe mensen in razernij de controle over de verzorging van hun taal verliezen")

Maarten Malaise 29 maart 2008 14:04

Citaat:

Oorspronkelijk geplaatst door kay-gell (Bericht 3330734)
Dit hoort wel niet bij binnenlandse, hé. Foei! :-)

Maar al bij al, inderdaad toch wel een eer.

je hebt gelijk. Verplaatst.

Maarten

stab 29 maart 2008 14:09

Men kan alvast hiermee beginnen:
http://forum.politics.be/search.php?searchid=884459
:mrgreen:

Savatage 29 maart 2008 14:15

Dan worden onze schrijfsels toch nog voor iets gebruikt :mrgreen:

groene flamingant 29 maart 2008 14:36

Schitterend idee.

brother paul 29 maart 2008 17:19

amai, al mijn samentrekkingen van woorden zal toch wel een bizar vuilbakje van woorden opleveren.

system 29 maart 2008 17:25

Citaat:

Oorspronkelijk geplaatst door brother paul (Bericht 3331041)
amai, al mijn samentrekkingen van woorden zal toch wel een bizar vuilbakje van woorden opleveren.

De Nederlandse Taalunie zouden ze moeten afschaffen. Ze bakken er niets van en brengen de mensen voordurend in verwarring met hun 'aanpassingen'. Eén grote puinhoop maken ze ervan in de geesten van de mensen voor wat betreft hun taalvastheid. Rust, rust en nog eens rust moeten we hebben op dit vlak. Voor minstens de 10 �* 15 komende jaren.

undiscovered 29 maart 2008 17:33

Citaat:

Oorspronkelijk geplaatst door Jazeker (Bericht 3330705)
Het is inderdaad een hele eer voor het forum.

(tussen haakjes: ik vraag 10 cent per woord...)

ga je zaken doen?

ik denk dat je een dikke boterham zal verdienen.

duveltje382 29 maart 2008 18:31

Mooie eno2 zal hier zeker in kunnen bijdragen,ere wie ere toekomt :-D

Derk de Tweede 31 maart 2008 11:41

Hondenhok; kippenhok; voort; bietmuziek; nozems; oetlul; weggewaaid kippenhok; zaadloze betonmolen.

forzaflandria 31 maart 2008 15:15

Nog hoeveel uren tot 1 april?

filosoof 31 maart 2008 15:26

100.000.000 woorden? :? Daar zullen veel dubbeltellingen bij zijn:
kijk eens hier naar het aantal woorden /woordenboek voor een aantal talen/woordenboeken:
http://www.authsecu.com/dictionnaire/dictionnaire.php

Flippend Rund 31 maart 2008 15:44

Citaat:

Oorspronkelijk geplaatst door filosoof (Bericht 3335050)
100.000.000 woorden? :? Daar zullen veel dubbeltellingen bij zijn:
kijk eens hier naar het aantal woorden /woordenboek voor een aantal talen/woordenboeken:
http://www.authsecu.com/dictionnaire/dictionnaire.php

Ja. Het is de bedoeling van een corpus dat je vele malen hetzelfde woord hebt, gebruikt in verschillende zinnen.

stab 31 maart 2008 17:19

'Aardappelautomaat' en natuurlijk ook 'aardappelautomaataardappelen'.
:mrgreen:

longhorn 1 april 2008 03:50

Jullie, mods, moeten dan alleszins Duncan ontbannen.

Rudy 1 april 2008 20:41

Citaat:

Oorspronkelijk geplaatst door Maarten Malaise (Bericht 3330688)
Wat vinden jullie hiervan: Het forum van Politics.be als basis voor weteschappelijk onderzoek. Er worden 100 miljoen woorden gezocht die in hun eigen verband moeten staan voor de aanmaak van een referentiecorpus waarin het Vlaams goed vertegenwoordigd wordt. Forum is volgens mij al goed voor meer dan 50 miljoen woorden.

Ik vind het een hele eer.

Maarten

Citaat:

Oorspronkelijk geplaatst door Nederlandse Taalunie
Als Politics.be kunt u ons wellicht verder helpen en zou u een hoogst
welkome inbreng kunnen hebben als tekstleverancier van dit soort data.
Daarbij denken we hoofdzakelijk aan teksten die aanwezig zijn op uw site:
http://forum.politics.be/, zowel de stellingen als de reacties erop.

Oeps, en ik die dacht dat het over de reacties op het forum ging.

Waarom wordt ons mening eigenlijk gevraagd ?


Alle tijden zijn GMT +1. Het is nu 08:15.

Forumsoftware: vBulletin®
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Content copyright ©2002 - 2020, Politics.be