signos de puntuación.

Las siguientes etiquetas son utilizadas para los signos de puntuación:

Para hacer una búsqueda de puntuación existen varias opciones:

búsquedas por lengua (no principal).

Las lenguas principales de OSTA son las siguientes:

y es posible filtrar y ordenar los resultados utilizando el filtro "Lengua principal".

Sin embargo, cuando un texto contiene pasajes escritos en una lengua que no sea ninguna de las lenguas principales, las palabras de estos pasajes tienen como lema la etiqueta de la lengua correspondiente. Según esto, la consulta

devuelve todas las palabras etiquetadas como hebreas, mientras que la consulta

devuelve todas las palabras latinas que comienzan por a.

Además, todas las palabras de cualquier lengua no principal tienen asignada la misma etiqueta gramatical, LANG, por lo que la consulta

devuelve todas las palabras en el corpus que no pertenecen a ninguna de las lenguas principales.

búsqueda de formas desconocidas.

Existe en OSTA también un número reducido, pero significativo de palabras (menos de 250.000, aproximadamente 0.6% del total) que el etiquetador morfológico ha sido incapaz de identificar. Todas las palabras desconocidas tienen el lema UNK. Así, la consulta

devuelve todas las palabras desconocidas en el corpus que terminan en -ones.