Wayback Machine
mai JUIN juil.
Previous capture 12 Next capture
2016 2017 2018
Retour à l'index des sites archivés
Cette capture de site Web a été effectuée le 12 juin 2017 à des fins de préservation par Bibliothèque et Archives nationales du Québec.
Certains liens internes et externes ainsi que les formulaires, la recherche et les éléments interactifs du site, y compris les vidéos, peuvent ne pas fonctionner.
Bibliothèque et Archives nationales du Québec. Cette capture de site Web a été effectuée le 12 juin 2017 à des fins de préservation par Bibliothèque et Archives nationales du Québec.

 




Teatro de los

Siglos de Oro






Página base

Revista
Teatro de palabras


Seminario
Informática de texto


Analizador
Brocense


Banco textual

Otros contenidos










Propuesta de etiquetado XML de
un texto teatral áureo

>>> Textos

>>> Función y formatos de este banco

>>> Manuales

Por un modelo estructural del documento de teatro áureo

  • ¿Un texto es una simple serie de palabras? Evidentemente no: el estatuto textual de las palabras —la diferencia, por ejemplo, entre "las que se dicen" y "las que se hacen" en el teatro— queda determinado ante todo, en el caso que nos ocupa, por el elemento al que pertenecen o que constituyen: réplica, acotación, hablante, marca de aparte, etc.
  • Ahora bien, si el estatuto textual de una palabra es realmente significativo —y lo es—, parece útil "marcar" (de manera invisible) el texto con esos estatutos para poder recuperar esa información (por medios infoasistidos) al lado de la puramente semántica o sintagmática: saber no sólo lo que se dice en el texto, sino también cuándo se dice y quién es el que habla.
  • Ese es el sentido de un modelo estructural de elementos y relaciones en un tipo dado de documento, el teatral de los Siglos de Oro en nuestro caso: tender a un protocolo consensuado que identifique lo que hay que marcar y la manera de hacerlo.
  • Por otra parte, en un contexto como el actual, en que están desapereciendo las fronteras entre el libro-papel, el texto servido en línea y el libro electrónico, esa definición de elementos permite disponer de un solo documento de base, adaptable a cada uno de esos medios, así como a las necesidades de análisis.
  • El "lenguaje extensible de marcación" (XML) es el estándar actual que responde a estas funciones. El modelo que proponemos se inscribe en las líneas de desarrollo de XML y adopta la forma de una "definición de tipo de documento" (DTD) para el teatro áureo y de una "hoja de estilos en cascada" (CSS) para su edición en línea dentro de las normas de este lenguaje.
  • El gráfico que sigue presenta el modelo propuesto en forma de estructura de conjuntos: un documento de teatro áureo puede tener una "carpeta" (título...) y tiene un texto; el texto tiene uno o más segmentos (jornadas...), puede tener acotaciones y tiene una o más réplicas; la réplica... Cada uno de los elementos está descrito con más detalle en el documento ElementosBs.

Condiciones de los elementos en cuanto al número de ocurrencias (convención XML):

  • ? tras el nombre de un elemento significa "cero o uno"
  • * tras el nombre de un elemento significa "cero o más"
  • + tras el nombre de un elemento significa "uno o más"
  • ninguna marca tras el nombre de un elemento significa "uno" (individuo o conjunto)

Etiquetas infrecuentes:

  • "Carpeta" reúne el conjunto de informaciones textuales que nombran y encierran el texto como tal.
  • "EtiSegmento" es la etiqueta que marca el principio de cada una de las jornadas o de las secuencias de un texto.
  • "Encabalgamiento" se refiere al fenómeno que denominamos "encabalgamiento dialógico" (principio de réplica sin principio de verso, a veces llamado "verso trunco"), uno de los índices que marcan más claramente la viveza del diálogo.
  • "ApartePer" marca un aparte a un personaje.
  • "NúmVer" indica la numeración de los versos.

Principales marcas de los elementos del modelo


marca inicial
marca final
Marca de en BSteatro (v. ElementosBS, EditarBS) en XML*
documento (principio de carpeta)
} (
espacio y "llave", marca de final de texto)
<documento>
</documento>
"carpeta" ***carpeta***
***/carpeta***
<carpeta>
</carpeta>
título (¶) (segundo párrafo) <tirulo>
</tirulo>
autor (¶) (tercer párrafo) <autor>
</autor>
editor (¶) (cuarto párrafo) <editor>
</editor>
lista de personajes (dede sexto párrafo)
(hasta párrafo anterior a "indicaciones")
<personajes>
</personajes>
personaje (¶) (desde séptimo párrafo)
(hasta párrafo anterior a "indicaciones")
<personaje>
</personaje>
indicaciones (¶) **
/**
<indicaciones>
</indicaciones>
texto (tras cierre de carpeta)
(hasta párrafo anterior a colofón o hasta })
<texto>
</texto>
segmento (se inicia con la etiqueta) &&&AXXX00,00&&&
(termina ante etiqueta siguiente/colofón/ })
<segmento>
</segmento>
etiSegmento (¶)
[etiqueta de segmento]
&&& (seguido de AXXX00,00)
&&&
<etisegmento>
</etisegmento>
acotación (¶) (
)
<acotacion>
</acotacion>
réplica (¶) (se inicia con la etiqueta) #
(termina ante
siguiente #/acotación/segmento/colofón/ })
<replica>
</replica>
hablante # (seguido del nombre del HABLANTE en una palabra)
 > (espacio y "mayor que")
<speaker>
</speaker>
verso  / (espacio, barra y espacio) <ver />
[sólo marca de inicio]
encabalgamiento
[principio de réplica sin principio de verso]
 < (espacio, "menor que" y espacio) <enc />
[sólo marca de inicio]
aparte (Ap.
) [encierra el texto dicho]
<aparte>
</aparte>
apartePer
[aparte a un personaje]
(Apar. a PPP) [encierra "a" + OYENTE] <aparteper>
</aparteper>
inciso -iii
- [iii = texto dicho, encerrado entre guiones]
<inciso>
</inciso>
prosa (Pr.
) [encierra el texto dicho]
<prosa>
</prosa>
cita (Ct.
) [encierra el texto dicho]
<cita>
</cita>
númVer
[número de verso]
(al final de verso) < nnn <numver>
</numver>
colofón (¶) ***colofon***
***/colofon***
[encierra el texto impreso]
<colofon>
</colofon>
paginación espacio [ppp/hhh/fff]; ejemplo: [p. 2]
(situada inmediatamente tras el último texto de la página 1, marca el inicio de la página 2)
<paginacion>
</paginacion>
interpolación espacio [texto] / [texto]
(encierra el texto añadido por el editor)
<interpolacion>
</interpolacion>

* XML: lenguaje extensible de marcación que permite, con ayuda de marcas o etiquetas, identificar cada uno de los elementos jerárquicamente imbricados que integran el texto.


Nuestra definición de tipo de documento (DTD) del teatro áureo en formato XML

Una DTD es una definición de la estructura jerárquica de los elementos que forman un texto.

[http://www.uqtr.ca/teatro/banco/docteatro.dtd]

<!ELEMENT documento (carpeta, texto, colofon?)>
<!-- Ricardo Serrano Deza, septiembre de 2011 -->
<!ELEMENT carpeta (titulo+, autor, editor, personajes, indicaciones+)>
<!ELEMENT titulo (#PCDATA | interpolacion)*>
<!ELEMENT autor (#PCDATA | interpolacion)*>
<!ELEMENT editor (#PCDATA)>
<!ELEMENT personajes (#PCDATA | personaje)*>
<!-- Una primera línea como "Personas que hablan en ella" da generalmente paso a la lista de personajes. -->
<!ELEMENT personaje (#PCDATA | interpolacion)*>
<!ELEMENT indicaciones (#PCDATA)>
<!ELEMENT texto (segmento+)>
<!ELEMENT segmento (etisegmento, (acotacion | replica | paginacion)*)>
<!ELEMENT etisegmento (#PCDATA)>
<!ELEMENT acotacion (#PCDATA | interpolacion)*>
<!ELEMENT replica (#PCDATA | speaker | enc | ver | numver | interpolacion | acotacion | aparte | aparteper | inciso | cita | prosa | paginacion)*>
<!-- Por economía de expresión, esta DTD minimalista no prescribe el evidente orden: 1 speaker, 2 enc[abalgamiento](?), 3 otros ELEMENTos. -->
<!ELEMENT speaker (#PCDATA | interpolacion)*>
<!ELEMENT enc empty>
<!ELEMENT ver empty>
<!ELEMENT numver (#PCDATA)>
<!ELEMENT aparte (#PCDATA | interpolacion | ver | numver)*>
<!ELEMENT aparteper (#PCDATA | interpolacion)*>
<!ELEMENT inciso (#PCDATA | interpolacion | ver | numver)*>
<!ELEMENT cita (#PCDATA | interpolacion | ver | numver)*>
<!ELEMENT prosa (#PCDATA | interpolacion)*>
<!ELEMENT paginacion (#PCDATA)>
<!ELEMENT interpolacion (#PCDATA)>
<!ELEMENT colofon (#PCDATA)>

A este respecto y sobre el conjunto de la cuestión, véase la documentación del proyecto Text Encoding Initiative (Wiki, DTD), así como la iniciativa desarrollada en este marco por el proyecto Tesoro —edición XML de teatro áureo— de la Universidad Carlos III de Madrid (obras editadas, DTD, CSS). Nótese que la DTD propuesta por el proyecto Text Encoding Initiative no marca, a pesar de su amplitud, varios elementos que son determinantes en el teatro áureo, como el "encabalgamiento dialógico", que aquí sí consideramos.


Nuestra hoja de estilos en cascada (CSS) para el teatro áureo editado en XML

Una hoja CSS indica el formato material adoptado por cada uno de los elementos que forman un texto.

[http://www.uqtr.ca/teatro/banco/docteatro.css]


Uso de la DTD y de la CSS propuestas

  • Cualquier edición XML de teatro áureo que corresponda a la estructura descrita puede utilizar la DTD y la CSS propuestas declarando los correspondientes enlaces y citando su procedencia:
    • para la DTD, intercalar como segunda línea del documento XML la siguiente declaración
      <!DOCTYPE documento SYSTEM "http://www.uqtr.ca/teatro/banco/docteatro.dtd">
      [... standalone="no" en la primera línea]
    • para la CSS, intercalar como tercera línea del documento XML la siguiente declaración
      <?xml-stylesheet type="text/css" href="http://www.uqtr.ca/teatro/banco/docteatro.css"?>
    • para ambas, citar en el texto legible:
      Este documento utiliza las normas-recursos DTD y CSS de Teatro áureo, Ricardo Serrano Deza, 2011, portal Teatro de los Siglos de Oro, http://www.uqtr.ca/teatro
    • La correspondencia de una edición XML con su correspondiente DTD puede validarse automáticamente en el formulario en línea de Brown University:
      http://www.stg.brown.edu/service/xmlvalid/
    • Se ruega notificar el uso de nuestras DTD y CSS para poder recibir información sobre ajustes futuros de estos documentos.

>>> Textos

>>> Función y formatos de este banco






Última revisión
de esta página:
  20 de diciembre de 2011




Entradas
contabilizadas por
Google Analytics





Páginas albergadas
desde 1995
por la



Université
du Québec à
Trois-Rivières