Continguts
1. Selección de textos
1.1 Buscar textos que ofrezcan elementos poco o muy diferenciados en relación con el estándar.
1.2 Selección de textos inéditos y de textos publicados (preferiblemente, la primera edición).
1.3 Selección específica de textos de los géneros que han sido menos representados en la selección inicial.
2. Descripción del proyecto
Transcripción de textos: establecimiento de criterios
2.1 Textos transcritos (y publicados)
2.2 Textos inéditos
2.2.1 Textos medievales: aplicación de las normas de edición de «Els Nostres Clàssics»
Separación de palabras.
Apóstrofes y puntos volados según sea necesario.
Guiones o apóstrofes para separar pronombres del verbo.
Regularizamos el uso de u/v y i/j.
2.2.2 Textos a partir del siglo XVII: respecto de la grafía original
2.2.3 Marcas de transcripción
Utilizamos
<> Cuando eliminamos elementos que aparecen en el texto.
[] Cuando añadimos elementos, también dentro de los paréntesis cuadrados anotamos si se trata de elementos marginados, interlineado, rayados en el original.
[…] Cuando no transcribimos porque no lo entendemos o no es legible.
(…) Cuando queremos indicar que el fragmento se ha omitido, que no lo seleccionamos.
(¿) Lectura dudosa
Cursiva Desarrollo de abreviaturas. Si el editor no lo marca, no lo marcamos tampoco.
2.2.4 Tratamiento de las notas
Si son nuestras las numeramos sin ninguna otra marca.
Si son del editor les ponemos un * delante, además de la numeración correspondiente.
3. Informatización del corpus
3.1 Digitalización de los textos
3.2 Aplicación del formato de texto (Word)
3.3 Elaboración de la base de datos técnica (Access)
- Variedad, código, año, siglo, género
- Título del fragmento de texto, nombre del autor
- Referencia bibliográfica completa del texto
4. Códigos de identificación de los textos
Cada texto se ha codificado según los datos del dialecto, el año y el género textual a los que pertenece.
4.1 Codificación del dialecto y el subdialecto
- Balear: Bm (mallorquín), Bme (menorquín), Be (ibicenco)
- Central: C (central), Ct (Campo de Tarragona), Cs (septentrional de transición)
- Rosellonés: R
- Alguerès: A
- Valenciano: V (valenciano), Vs (septentrional), Va (central), Vm (meridional)
- Noroccidental: N (noroccidental), Np (pallarés), Nt (tortosino), N (ribagorzano)
4.2 Codificación del género
Categorización de tipos de texto (según el registro y la temática) a partir de los criterios del Corpus Textual Informatizado de la Lengua Catalana, del IEC (dirigido por Joaquim Rafel), adaptados a las características propias del corpus Scripta.
1. Narrativa
1.1 «Rondallística»
2. Poesía
2.1 Poesía popular
3. Teatro
3.1 Coloquios
3.2 Investigación literaria
4. Correspondencia
5. Filosofía
6. Religión
6.1 Sermones
6.2 Gozos
6.3 Hagiografía
6.4 Catequesis
6.5 Liturgia
6.6 Edictos, ordenanzas eclesiásticas
6.7 Profecías
7. Ciencias Sociales
7.1 Testamentos
7.2 Inventarios
7.3 Textos judiciales
7.4 Contratos
7.5 Pregones, edictos, actas, ordenanzas, determinaciones, instancias
7.6 Libros de cuentas y recibos
7.7 Enseñanza, urbanidad
7.8 Otros
8. Prensa
9. Ciencias Naturales
9.1 Meteorología
9.2 Astronomía, astrología
9.3 Zoología
9.4 Botánica
9.5 Geología
10 Ciencias aplicadas
10.1 Medicina
10.2 Agricultura
10.3 Náutica
10.4 Veterinaria
10.5 Gastronomía
10.6 Artes y oficios (construcción…)
10.7 Economía
10.8 Milicia
11. Bellas Artes. Diversiones. Juegos. Deportes
12. Lingüística
12.1 Lexicografía
12.2 Gramática
12.3 Otros (apologías)
12.4 Onomástica
13. Historia y geografía
13.1 Historia
13.2 Geografía
13.3 Dietarios
14. Ciencias puras
4.3 Código identificador del texto
De acuerdo con el año de redacción del texto (real o aproximado si la fecha es desconocida) y con las codificaciones establecidas para los dialectos y los tipos de texto, el tipo de código que identifica los textos es el siguiente:
Dialecto-año-género
Ejemplo: Be-1.560-7.2 (= ibicenco-año 1560-inventarios)
5. Formalización y selección de los datos lingüísticos
5.1 Codificación de los fenómenos fonéticos, morfológicos, sintácticos y léxicos más destacables
5.2 Aplicación de los datos lingüísticos codificados en cada uno de los textos del balear
5.3 Elaboración de códigos estándares para el análisis lingüístico de todos los textos seleccionados
6. Esquema de redacción de los comentarios
6.1 Encabezamiento
- Dialecto
- Código del texto
- Autor: título del texto
6.2 Comentario lingüístico
a)
- Referencia documental y/o bibliográfica comentada del texto (texto inédito, corrección de un texto publicado, edición, etc.)
- Referencia sobre el autor, cuando el texto no es anónimo
- Contextualización del documento
b)
- Grafía
- Fonética
- Morfosintaxis
- Léxico
c)
- Valoración de los datos lingüísticos del texto
6.3 Texto
Reproducción del texto transcrito y digitalizado
7. Glosario
7.1 Marcaje de las formas comentadas
7.2 Indexación del glosario: variante y código de texto