Metodología del Proyecto Scripta

1. Selección de textos

1.1 Buscar textos que ofrezcan elementos poco o muy diferenciados en relación con el estándar.

1.2 Selección de textos inéditos y de textos publicados (preferiblemente, la primera edición).

1.3 Selección específica de textos de los géneros que han sido menos representados en la selección inicial.

2. Descripción del proyecto

Transcripción de textos: establecimiento de criterios

2.1 Textos transcritos (y publicados)

2.2 Textos inéditos

2.2.1 Textos medievales: aplicación de las normas de edición de «Els Nostres Clàssics»

Separación de palabras.

Apóstrofes y puntos volados según sea necesario.

Guiones o apóstrofes para separar pronombres del verbo.

Regularizamos el uso de u/v y i/j.

2.2.2 Textos a partir del siglo XVII: respecto de la grafía original

2.2.3 Marcas de transcripción

Utilizamos

<> Cuando eliminamos elementos que aparecen en el texto.

[] Cuando añadimos elementos, también dentro de los paréntesis cuadrados anotamos si se trata de elementos marginados, interlineado, rayados en el original.

[…] Cuando no transcribimos porque no lo entendemos o no es legible.

(…) Cuando queremos indicar que el fragmento se ha omitido, que no lo seleccionamos.

(¿) Lectura dudosa

Cursiva Desarrollo de abreviaturas. Si el editor no lo marca, no lo marcamos tampoco.

2.2.4 Tratamiento de las notas

Si son nuestras las numeramos sin ninguna otra marca.

Si son del editor les ponemos un * delante, además de la numeración correspondiente.

3. Informatización del corpus

3.1 Digitalización de los textos

3.2 Aplicación del formato de texto (Word)

3.3 Elaboración de la base de datos técnica (Access)

  • Variedad, código, año, siglo, género
  • Título del fragmento de texto, nombre del autor
  • Referencia bibliográfica completa del texto

4. Códigos de identificación de los textos

Cada texto se ha codificado según los datos del dialecto, el año y el género textual a los que pertenece.

4.1 Codificación del dialecto y el subdialecto

  • Balear: Bm (mallorquín), Bme (menorquín), Be (ibicenco)
  • Central: C (central), Ct (Campo de Tarragona), Cs (septentrional de transición)
  • Rosellonés: R
  • Alguerès: A
  • Valenciano: V (valenciano), Vs (septentrional), Va (central), Vm (meridional)
  • Noroccidental: N (noroccidental), Np (pallarés), Nt (tortosino), N (ribagorzano)

4.2 Codificación del género

Categorización de tipos de texto (según el registro y la temática) a partir de los criterios del Corpus Textual Informatizado de la Lengua Catalana, del IEC (dirigido por Joaquim Rafel), adaptados a las características propias del corpus Scripta.

1. Narrativa
    1.1 «Rondallística»
2. Poesía
    2.1 Poesía popular
3. Teatro
    3.1 Coloquios
    3.2 Investigación literaria
4. Correspondencia
5. Filosofía
6. Religión
    6.1 Sermones
    6.2 Gozos
    6.3 Hagiografía
    6.4 Catequesis
    6.5 Liturgia
    6.6 Edictos, ordenanzas eclesiásticas
    6.7 Profecías
7. Ciencias Sociales
    7.1 Testamentos
    7.2 Inventarios
    7.3 Textos judiciales
    7.4 Contratos
    7.5 Pregones, edictos, actas, ordenanzas, determinaciones, instancias
    7.6 Libros de cuentas y recibos
    7.7 Enseñanza, urbanidad
    7.8 Otros
8. Prensa
9. Ciencias Naturales
    9.1 Meteorología
    9.2 Astronomía, astrología
    9.3 Zoología
    9.4 Botánica
    9.5 Geología
10 Ciencias aplicadas
    10.1 Medicina
    10.2 Agricultura
    10.3 Náutica
    10.4 Veterinaria
    10.5 Gastronomía
    10.6 Artes y oficios (construcción…)
    10.7 Economía
    10.8 Milicia
11. Bellas Artes. Diversiones. Juegos. Deportes
12. Lingüística
    12.1 Lexicografía
    12.2 Gramática
    12.3 Otros (apologías)
    12.4 Onomástica
13. Historia y geografía
    13.1 Historia
    13.2 Geografía
    13.3 Dietarios
14. Ciencias puras

4.3 Código identificador del texto

De acuerdo con el año de redacción del texto (real o aproximado si la fecha es desconocida) y con las codificaciones establecidas para los dialectos y los tipos de texto, el tipo de código que identifica los textos es el siguiente:

Dialecto-año-género

Ejemplo: Be-1.560-7.2 (= ibicenco-año 1560-inventarios)

5. Formalización y selección de los datos lingüísticos

5.1 Codificación de los fenómenos fonéticos, morfológicos, sintácticos y léxicos más destacables

5.2 Aplicación de los datos lingüísticos codificados en cada uno de los textos del balear

5.3 Elaboración de códigos estándares para el análisis lingüístico de todos los textos seleccionados

6. Esquema de redacción de los comentarios

6.1 Encabezamiento

  • Dialecto
  • Código del texto
  • Autor: título del texto

6.2 Comentario lingüístico

a)

  • Referencia documental y/o bibliográfica comentada del texto (texto inédito, corrección de un texto publicado, edición, etc.)
  • Referencia sobre el autor, cuando el texto no es anónimo
  • Contextualización del documento

b)

  • Grafía
  • Fonética
  • Morfosintaxis
  • Léxico

c)

  • Valoración de los datos lingüísticos del texto

6.3 Texto

Reproducción del texto transcrito y digitalizado

7. Glosario

7.1 Marcaje de las formas comentadas

7.2 Indexación del glosario: variante y código de texto