Metodologia del projecte Scripta

1. Selecció de textos

1.1 Cercar textos que ofereixin elements poc o molt diferenciats en relació amb l’estàndard.

1.2 Selecció de textos inèdits i de textos publicats (preferiblement, la primera edició).

1.3 Selecció específica de textos dels gèneres que han estat menys representats en la selecció inicial.

2. Descripció del projecte

nobleses dels reis

Transcripció de textos: establiment de criteris

2.1 Textos transcrits (i publicats)
2.2 Textos inèdits

2.2.1 Textos medievals: aplicació de les normes d’edició de «Els Nostres Clàssics»

Separació de mots.
Apòstrofs i punts volats segons calgui.
Guionets o apòstrofs per separar pronoms del verb.
Regularitzem l’ús de u/v i i/j.

2.2.2 Textos a partir del segle XVII: respecte de la grafia original

2.2.3 Marques de transcripció

Utilitzem

< > Quan eliminem elements que surten en el text.
[ ] Quan afegim elements, també a dins dels parèntesis quadrats anotem si es tracta d’elements marginats, interliniats, ratllats en l’original.
[…] Quan no transcrivim perquè no ho entenem o no és llegible.
(…) Quan volem indicar que el fragment s’ha omès, que no el seleccionem.
(¿) Lectura dubtosa
Cursiva Desenvolupament d’abreviatures. Si l’editor no ho marca, no ho marquem tampoc.

2.2.4 Tractament de les notes
Si són nostres les numerem sense cap altra marca.
Si són de l’editor els posem un * al davant, a més de la numeració corresponent.

3. Informatització del corpus

3.1 Digitalització dels textos

3.2 Aplicació del format de text (Word)

3.3 Elaboració de la base de dades tècnica (Access)

  • Varietat, codi, any, segle, gènere
  • Títol del fragment de text, nom de l’autor
  • Referència bibliogràfica completa del text

4. Codis d’identificació dels textos

Cada text s’ha codificat segons les dades del dialecte, l’any i el gènere textual als quals pertany.

4.1 Codificació del dialecte i el subdialecte

  • Balear: Bm (mallorquí), Bme (menorquí), Be (eivissenc)
  • Central: C (central), Ct (tarragoní), Cs (septentrional de transició)
  • Rossellonès: R
  • Alguerès: A
  • Valencià: V (valencià), Vs (septentrional), Va (apitxat), Vm (meridional)
  • Nord-occidental: N (nord-occidental), Np (pallarès), Nt (tortosí), Nr (ribagorçà)

4.2 Codificació del gènere

Categorització de tipus de text (segons el registre i la temàtica) a partir dels criteris del Corpus Textual Informatitzat de la Llengua Catalana, de l’IEC (dirigit per Joaquim Rafel), adaptats a les característiques pròpies del corpus Scripta.

1. Narrativa
    1.1 Rondallística
2. Poesia
    2.1 Poesia popular
3. Teatre
    3.1 Col·loquis
    3.2 Investigació literària
4. Correspondència
5. Filosofia
6. Religió
    6.1 Sermons
    6.2 Goigs
    6.3 Hagiografia
    6.4 Catequesi
    6.5 Litúrgia
    6.6 Edictes, ordinacions eclesiàstiques
    6.7 Profecies
7. Ciències socials
    7.1 Testaments
    7.2 Inventaris
    7.3 Textos judicials
    7.4 Contractes
    7.5 Pregons, edictes, actes, ordinacions, determinacions, instàncies
    7.6 Llibres de comptes i rebuts
    7.7 Ensenyament, urbanitat
    7.8 Altres
8. Premsa
9. Ciències naturals
    9.1 Meteorologia
    9.2 Astronomia, astrologia
    9.3 Zoologia
    9.4 Botànica
    9.5 Geologia
10 Ciències aplicades
    10.1 Medicina
    10.2 Agricultura
    10.3 Nàutica
    10.4 Veterinària
    10.5 Gastronomia
    10.6 Arts i oficis (construcció…)
    10.7 Economia
    10.8 Milícia
11. Belles Arts. Divertiments. Jocs. Esports
12. Lingüística
    12.1 Lexicografia
    12.2 Gramàtica
    12.3 Altres (apologies)
    12.4 Onomàstica
13. Història i geografia
    13.1 Història
    13.2 Geografia
    13.3 Dietaris
14. Ciències pures

4.3 Codi identificador del text

D’acord amb l’any de redacció del text (real o aproximat si la data és desconeguda) i amb les codificacions establertes per als dialectes i els tipus de text, el tipus de codi que identifica els textos és el següent:

Dialecte-any-gènere

Exemple: Be-1560-7.2 (= eivissenc-any 1560-inventaris)

5. Formalització i selecció de les dades lingüístiques

5.1 Codificació dels fenòmens fonètics, morfològics, sintàctics i lexicals més destacables
5.2 Aplicació de les dades lingüístiques codificades en cadascun dels textos del balear
5.3 Elaboració de codis estàndards per a l’anàlisi lingüística de tots els textos seleccionats

6. Esquema de redacció dels comentaris

6.1 Encapçalament

  • Dialecte
  • Codi del text
  • Autor: títol del text

6.2 Comentari lingüístic

a)

  • Referència documental i/o bibliogràfica comentada del text (text inèdit, correcció d’un text publicat, edició, etc.)
  • Referència sobre l’autor, quan el text no és anònim
  • Contextualització del document

b)

  • Grafia
  • Fonètica
  • Morfosintaxi
  • Lèxic

c)

  • Valoració de les dades lingüístiques del text

6.3 Text

Reproducció del text transcrit i digitalitzat

7. Glossari

7.1 Marcatge de les formes comentades
7.2 Indexació del glossari: variant i codi de text