caracteres comodín y operadores
Si se quieren encontrar todas las formas del sustantivo "planta", es posible hacer las siguientes dos consultas: [(word='planta'%c)] y [(word='plantas'%c)], sin embargo, además de no tener los resultados en una única consulta, estos incluyen tanto la forma verbal como el sustantivo. Para evitar esto se pueden utilizar caracteres comodín y operadores y efectuar una búsqueda combinada para especificar tanto formas en singular y plural como la categoría gramatical: [(word='plantas?' & pos='NC.*'%c)], y lo que ahora se busca son las palabras planta o plantas cuando son un sustantivo (con el comodín ? se indica que el carácter que le precede puede aparecer cero veces o una vez, y con el operador .* que la etiqueta gramatical debe empezar por NC). A continuación se describen los caracteres comodín y los operadores más habituales:
| comodín | significado |
|---|---|
. |
equivale a un único carácter: [(word='ca.a'%c)] → cada, cala, cama, cara, casa, …; [(word='ca..a'%c)] → cabra, cabsa, caida, carta, causa, … |
.* |
equivale a cero o más caracteres: [(word='amarga.*'%c)] → amarga, amargad, amargado, amargamente, … |
.+ |
equivale a uno o más caracteres: [(word='amarga.+'%c)] → amargad, amargado, amargamente, … pero no amarga |
..+ |
equivale a tres o más caracteres: [(word='amarga..+'%c)] → amargados, amargamente … pero no amarga, amargar, amargado |
? |
el carácter que le precede puede aparecer cero veces o una vez: [(word=res?cebir'%c)] → recebir y rescebir |
* |
el carácter que le precede puede aparecer cero o más veces: [(word='cas*as*'%c)] → casa, casas, cassa, cassas |
+ |
el carácter que le precede puede aparecer una o más veces: [(word='car+o'%c)] → caro y carro |
{n} |
el carácter o la expresión que le precede puede aparecer tantas veces como indique n (nº de ocurrencias): [(word='.*o{2}.*'%c)] → para todas las palabras que contienen dos oes seguidas: Bootes, loor, etc.; [(pos='NP.*'%c)]{2} → para obtener todas las ocurrencias de dos nombre propios seguidos: Ruy Diaz, Pero Vermudez, Minaya Albarfanez, etc. |
{m,n} |
operador de repetición (m = número mínimo, n = número máximo de palabras): [(pos='DA.*'%c)] [(pos='A.*'%c)]{1,2} [(lemma='hombre'%c) | (lemma='mujer'%c)] → para obtener todas las ocurrencias de un artículo definido seguido por uno o dos adjetivos, más cualquiera de las formas de los lemas hombre o mujer. |
[] |
los corchetes, sin espacio entre ellos, equivalen a una única palabra: [(word='yo'%c)] [] [(word='doy'%c)] → para encontrar las palabras que aparecen entre yo y doy; [(lemma='dar'%c)] [] [(pos='SP.*'%c)] [] → para encontrar todas las palabras que ocurren en una cadena de palabras. |
[ ] |
cualquiera de los caracteres dentro de los corchetes puede aparecer como mucho una vez: [(word='pro[buv]ar'%c)] → probar, prouar, provar. |
[ ]* |
cualquiera de los caracteres dentro de los corchetes puede aparecer cero o más veces: [(word='tra[buv]a[jlx]*o'%c)\] → trabajo, traballo, trabaxo, trauajo, trauallo, trauaxo, travajo |
[^ ] |
cualquier carácter, excepto los caracteres dentro de los corchetes, puede aparecer: [(word='a[^mt]ar'%c)] → abar, açar, acar, adar, agar, aiar, alar, anar, apar, arar, asar, auar, azar, aƽar, pero no amar o atar |
! |
operador de negación, [(pos!='V.*'%c)] → para encontrar todas las formas de las categorías gramaticales presentes en una obra, autor, etc., excepto las verbales |
Diferentes caracteres comodín y operadores pueden combinarse para efectuar consultas más complejas. Por ejemplo:
[(word='h?a[buv]er'%c)]→ para encontrar todas las variantes ortográficas del infinitivo haber.[(word='fruc?[ht].*'%c)]→ para encontrar todas las variantes ortográficas de fruta/fruto.