Tagset für Verben

Kategorien für Verben

In "Standards for Tagsets" schlagen Geoffrey Leech und Andrew Wilson folgende Kategorien fü das Taggen von Verben vor:

  1. Person (1., 2., 3.)
  2. Geschlecht (m, f, n)
  3. Anzahl (sg, pl)
  4. Finität (Finit, Infinit)
  5. Verbform / Modus (Indikativ, Subjunktiv, Imperativ, Konjunktiv, Infinitiv, Partizip, Gerund, Supin)
  6. Zeit (Präsens, Imperfekt, Futur, Vergangenheit)
  7. Stimme (aktiv, passiv)
  8. Status (haupt, auxiliar, halb-auxiliar)
  9. Aspekt (perfektiv, imperfektiv)
  10. Teilbarkeit (teilbar, unteilbar)
  11. Reflexivität (reflexiv, irreflexiv)
  12. Auxiliarität (haben, sein)
  13. Aux.-Funktion (primär, modal)

Albanische Verbformen

Erster Tagsetvorschlag

  [cat  : v,
   adm  : {+, -},
   mod  : {ind, konj, juss, opt, imv},
   stat : {akt, pas},
   temp : {prae, imp, per, pqp, aor, aor2,
           fut, futi, futp, futpq},
   pers : {1, 2, 3},
   num  : {sg, pl}]

  [cat  : pa,
   stat : {part, priv, ger, inf, abs},
   temp : {prae, per}]
      

Ein minimaler Tagsetvorschlag

Alle nicht morphologisch am Wort erkennbaren Kategorien werden weggelassen.

  [cat  : v,
   adm  : {+, -},
   mod  : {ind, konj, opt, imv},
   stat : {akt, pass},
   temp : {prae, imp, aor}
   pers : {1, 2, 3},
   num  : {sg, pl}]

  [cat  : pa]
	

Tempusanzeigende Verb-Partikel

Die Partikel wie u, do, le, të können auf verschiedenen Weise getaggt werden:

  1. als Partikel ohne weitere Angaben;
  2. als Verben, dann müßte aber das Tagset für Verben erweitert werden;
  3. als Partikel mit weiteren Angaben.
Ich werde den 3. Weg gehen.
[cat     : pl,
 merkmal : {pass, konj, juss, fut, konj-pass, abs, inf, ger, priv}]
	
In der folgenden Tabelle sind die tempusanzeigenden Verb-Partikel getaggt:

PartikelTag
do[cat: partikel, merkmal: fut]
le[cat: partikel, merkmal: jus]
[cat: partikel, merkmal: {fut, konj, jus}]
u[cat: partikel, merkmal: pass, ]
t'u[cat: partikel, merkmal: konj-pass]
pa[cat: partikel, merkmal : priv]
duke[cat: partikel, merkmal : ger]
për[cat: partikel, merkmal : inf]
me[cat: partikel, merkmal : abs]

Endungen

Ich habe die Verbendungen des Singular und die Endungen von Adjektiven und Adverben als ASCII-Dateien zusammengestellt.

Tagset und Regeln für Nicht-Wörter

Auch Zahlen, Satzzeichen, Klammern etc. brauchen ein Tagset. Dabei muß zwischen reinen Zahlen (1 16 ...), Nummerierungen (123A ...), satzabschließenden Satzzeichen (. ? !), einfachen Satzzeichen(, ; : -), öffnenden (( { [ <) und schließenden() } ] >) Klammern, Redemarkierungszeichen (" ' ´ `) und sonstigen Satzzeichen (& % § /) unterschieden werden. Im Folgenden das Tagset:

[cat  : nw,
 type : {nr, code, sentend, mark, openb, closeb, speech, other}]
      
Eine Datei mit diesen Regeln befindet sich hier.
Letzte Änderung am 19.11.2000 von Britta Koch