Continguts
1. Selecció de textos
1.1 Cercar textos que ofereixin elements poc o molt diferenciats en relació amb l’estàndard.
1.2 Selecció de textos inèdits i de textos publicats (preferiblement, la primera edició).
1.3 Selecció específica de textos dels gèneres que han estat menys representats en la selecció inicial.
2. Descripció del projecte
Transcripció de textos: establiment de criteris
2.1 Textos transcrits (i publicats)
2.2 Textos inèdits
2.2.1 Textos medievals: aplicació de les normes d’edició de «Els Nostres Clàssics»
Separació de mots.
Apòstrofs i punts volats segons calgui.
Guionets o apòstrofs per separar pronoms del verb.
Regularitzem l’ús de u/v i i/j.
2.2.2 Textos a partir del segle XVII: respecte de la grafia original
2.2.3 Marques de transcripció
Utilitzem
< > Quan eliminem elements que surten en el text.
[ ] Quan afegim elements, també a dins dels parèntesis quadrats anotem si es tracta d’elements marginats, interliniats, ratllats en l’original.
[…] Quan no transcrivim perquè no ho entenem o no és llegible.
(…) Quan volem indicar que el fragment s’ha omès, que no el seleccionem.
(¿) Lectura dubtosa
Cursiva Desenvolupament d’abreviatures. Si l’editor no ho marca, no ho marquem tampoc.
2.2.4 Tractament de les notes
Si són nostres les numerem sense cap altra marca.
Si són de l’editor els posem un * al davant, a més de la numeració corresponent.
3. Informatització del corpus
3.1 Digitalització dels textos
3.2 Aplicació del format de text (Word)
3.3 Elaboració de la base de dades tècnica (Access)
- Varietat, codi, any, segle, gènere
- Títol del fragment de text, nom de l’autor
- Referència bibliogràfica completa del text
4. Codis d’identificació dels textos
Cada text s’ha codificat segons les dades del dialecte, l’any i el gènere textual als quals pertany.
4.1 Codificació del dialecte i el subdialecte
- Balear: Bm (mallorquí), Bme (menorquí), Be (eivissenc)
- Central: C (central), Ct (tarragoní), Cs (septentrional de transició)
- Rossellonès: R
- Alguerès: A
- Valencià: V (valencià), Vs (septentrional), Va (apitxat), Vm (meridional)
- Nord-occidental: N (nord-occidental), Np (pallarès), Nt (tortosí), Nr (ribagorçà)
4.2 Codificació del gènere
Categorització de tipus de text (segons el registre i la temàtica) a partir dels criteris del Corpus Textual Informatitzat de la Llengua Catalana, de l’IEC (dirigit per Joaquim Rafel), adaptats a les característiques pròpies del corpus Scripta.
1. Narrativa
1.1 Rondallística
2. Poesia
2.1 Poesia popular
3. Teatre
3.1 Col·loquis
3.2 Investigació literària
4. Correspondència
5. Filosofia
6. Religió
6.1 Sermons
6.2 Goigs
6.3 Hagiografia
6.4 Catequesi
6.5 Litúrgia
6.6 Edictes, ordinacions eclesiàstiques
6.7 Profecies
7. Ciències socials
7.1 Testaments
7.2 Inventaris
7.3 Textos judicials
7.4 Contractes
7.5 Pregons, edictes, actes, ordinacions, determinacions, instàncies
7.6 Llibres de comptes i rebuts
7.7 Ensenyament, urbanitat
7.8 Altres
8. Premsa
9. Ciències naturals
9.1 Meteorologia
9.2 Astronomia, astrologia
9.3 Zoologia
9.4 Botànica
9.5 Geologia
10 Ciències aplicades
10.1 Medicina
10.2 Agricultura
10.3 Nàutica
10.4 Veterinària
10.5 Gastronomia
10.6 Arts i oficis (construcció…)
10.7 Economia
10.8 Milícia
11. Belles Arts. Divertiments. Jocs. Esports
12. Lingüística
12.1 Lexicografia
12.2 Gramàtica
12.3 Altres (apologies)
12.4 Onomàstica
13. Història i geografia
13.1 Història
13.2 Geografia
13.3 Dietaris
14. Ciències pures
4.3 Codi identificador del text
D’acord amb l’any de redacció del text (real o aproximat si la data és desconeguda) i amb les codificacions establertes per als dialectes i els tipus de text, el tipus de codi que identifica els textos és el següent:
Dialecte-any-gènere
Exemple: Be-1560-7.2 (= eivissenc-any 1560-inventaris)
5. Formalització i selecció de les dades lingüístiques
5.1 Codificació dels fenòmens fonètics, morfològics, sintàctics i lexicals més destacables
5.2 Aplicació de les dades lingüístiques codificades en cadascun dels textos del balear
5.3 Elaboració de codis estàndards per a l’anàlisi lingüística de tots els textos seleccionats
6. Esquema de redacció dels comentaris
6.1 Encapçalament
- Dialecte
- Codi del text
- Autor: títol del text
6.2 Comentari lingüístic
a)
- Referència documental i/o bibliogràfica comentada del text (text inèdit, correcció d’un text publicat, edició, etc.)
- Referència sobre l’autor, quan el text no és anònim
- Contextualització del document
b)
- Grafia
- Fonètica
- Morfosintaxi
- Lèxic
c)
- Valoració de les dades lingüístiques del text
6.3 Text
Reproducció del text transcrit i digitalitzat
7. Glossari
7.1 Marcatge de les formes comentades
7.2 Indexació del glossari: variant i codi de text