Chapitre 4. Corpus, données et méthode

4.0. Fonction du chapitre

Les chapitres précédents ont défini le cadre théorique du mémoire : les formes qatal, yiqtol, wayyiqtol et weqatal seront analysées non comme des valeurs isolées, mais comme des formes situées dans des clauses et participant à des opérations discursives. Le présent chapitre précise maintenant le statut des données sur lesquelles cette analyse repose.

L’objectif n’est pas de présenter le corpus comme une preuve statistique exhaustive du système verbal de toute la Bible hébraïque. Le corpus disponible doit être compris comme un corpus pilote, typologiquement riche, destiné à construire et tester une grille d’analyse.1. Le terme corpus pilote désigne ici un ensemble sélectionné pour sa densité typologique, non pour sa représentativité statistique. Il sert à stabiliser une méthode avant l’extension éventuelle à BHSA / ETCBC. Il permet de travailler finement sur les transitions entre formes, les alternances de régime discursif, le discours direct, la poésie et les cas ambigus. À côté de ce corpus pilote, un inventaire complet des formes verbales par livre biblique fournit un arrière-plan quantitatif général.

La méthode adoptée est donc mixte. Elle combine :

  1. un niveau macro, fondé sur l’inventaire complet des formes verbales ;
  2. un niveau méso, fondé sur les fréquences, transitions et cooccurrences dans le corpus pilote ;
  3. un niveau micro, fondé sur l’annotation manuelle des clauses et les lectures rapprochées.

Cette articulation est essentielle. Les chiffres ne remplacent pas l’analyse syntaxico-discursive ; ils indiquent où regarder. Inversement, les lectures rapprochées ne sont pas détachées du corpus ; elles s’inscrivent dans une distribution observable.

4.1. Données de départ

Le travail s’appuie sur des fichiers hérités de l’ancien projet, conservés dans historique/sources_originales/.2. Les données sources proviennent du projet antérieur : textes hébreux, translittération, traductions et inventaire morphologique. Le site Jekyll ne copie pas les versets dans les chapitres ; il les appelle depuis _data. Ces fichiers jouent des rôles différents et ne doivent pas être confondus.

Fichier Rôle dans le présent mémoire
historique/sources_originales/biblical-data/bible-selected.csv corpus pilote principal : 223 unités textuelles avec formes verbales balisées
historique/sources_originales/biblical-data/joint-data.ods table combinée des exemples, utile pour vérification manuelle
historique/sources_originales/hebtext.txt texte hébreu des exemples sélectionnés
historique/sources_originales/translit.txt translittération des exemples
historique/sources_originales/version.txt traduction française disponible pour plusieurs exemples
historique/sources_originales/english.txt traduction anglaise des exemples
historique/sources_originales/biblical-data/bibletranslate-selected.csv traductions associées au corpus sélectionné
historique/sources_originales/annexe_1.txt inventaire complet des formes verbales par livre biblique
historique/sources_originales/booknames.txt correspondance entre numéros de livres et noms français / anglais

Le fichier central est bible-selected.csv. Chaque ligne correspond à une unité textuelle, le plus souvent un verset ou un segment de verset. Les formes verbales y sont signalées par des balises placées après le texte hébreu entre accolades. Les quatre formes principales sont codées de la manière suivante :

Code dans le corpus Forme interprétée dans le mémoire
q qatal
y yiqtol
wy wayyiqtol
wq weqatal

Le balisage relie donc un code bref à une forme pleinement écrite : וַיֹּאמֶר wayyōmer ‘et il dit’ peut recevoir le code wy, tandis que יְהִי yəhî ‘qu’il soit’ relève de y. Le fichier ne contient donc pas seulement des références, mais une première couche d’analyse morphologique.

D’autres formes apparaissent également : participes, infinitifs, impératifs, formes rares ou étiquettes secondaires. Elles ne constituent pas l’objet central du mémoire, mais elles ne seront pas ignorées, car elles peuvent structurer le contexte d’une clause. Un participe ou une clause non finie peut, par exemple, fournir un arrière-plan ou interrompre une chaîne de formes principales.

imp impératif inf infinitif p participe q qatal qa qatal annoté qa qc qatal commentatif qp qatal poétique/particulier wplusy waw + yiqtol wq weqatal wy wayyiqtol y yiqtol yp yiqtol prétérital possible
Genèse 1.3 ID 3 · Gn 1-3
וַיֹּ֥אמֶר אֱלֹהִ֖ים יְהִ֣י א֑וֹר וַֽיְהִי ־אֽוֹר׃
wa-y-yṓmer ʾĕlōhī́m yᵉhī́ ʾṓr wá yᵉhī -ʾṓr
Dieu dit : "Que la lumière soit !" Et la lumière fut .
wayyiqtol yiqtol
Genèse 2.16 ID 47 · Gn 2-16
וַיְצַו֙ יְהוָ֣ה אֱלֹהִ֔ים עַל־הָֽאָדָ֖ם לֵאמֹ֑ר מִכֹּ֥ל עֵֽץ־הַגָּ֖ן אָכֹ֥ל תֹּאכֵֽל׃
wa yᵉṣáw ʔăḏōnā́y ʾĕlōhī́m ʿal-hā́ ʾādā́m lē ʾmṓr mi-k-kṓl ʿḗṣ-ha-g-gā́n ʾāxṓl tōxḗl
L’Éternel-Dieu donna un ordre à l’homme, en disant : "Tous les arbres du jardin, tu peux t’en nourrir ;
wayyiqtol infinitif participe yiqtol
Proverbes 14.1 ID 18049 · Pv 14-1
חַכְמ֣וֹת נָ֭שִׁים בָּנְתָ֣ה בֵיתָ֑הּ וְ֝אִוֶּ֗לֶת בְּיָדֶ֥יהָ תֶהֶרְסֶֽנּוּ׃
ḥaxmṓt ńāšīm bānᵉtā́ vētā́h ẃ ʾiwwélet bᵉ yādétehersénnū
qatal yiqtol

Le texte hébreu constitue la base de l’analyse. Les traductions française et anglaise servent d’aide à l’interprétation, mais elles ne déterminent pas la valeur des formes.3. Cette précaution reprend une leçon classique des études du verbe hébreu : la traduction indique un effet interprétatif, mais elle ne constitue pas une preuve directe de la valeur grammaticale de la forme. Cela est important, car l’un des problèmes du système verbal hébraïque vient précisément du fait qu’une même forme peut être traduite par plusieurs temps ou modes dans une langue moderne.

4.2. Composition du corpus pilote

Le corpus pilote contient 223 unités textuelles. Le recomptage des balises verbales donne 835 formes annotées au total. Parmi elles, 668 appartiennent aux quatre formes principales étudiées dans ce mémoire.

Forme Occurrences dans le corpus pilote Pourcentage des quatre formes principales
qatal 180 26,9 %
yiqtol 227 34,0 %
weqatal 71 10,6 %
wayyiqtol 190 28,4 %
total 668 100 %
Graphique des formes principales dans le corpus pilote
Répartition des quatre formes principales dans le corpus pilote : yiqtol est la forme la plus fréquente, mais qatal et wayyiqtol restent très proches.

Les autres formes annotées comprennent notamment 65 participes, 64 infinitifs et 25 impératifs, auxquels s’ajoutent quelques étiquettes plus rares. Ces formes seront mobilisées ponctuellement lorsqu’elles jouent un rôle dans la structure de la clause ou dans la transition entre clauses.

Le corpus est particulièrement utile pour l’analyse des alternances, car beaucoup d’unités contiennent plus d’une forme principale. 174 unités contiennent au moins deux occurrences des quatre formes principales ; 126 unités contiennent au moins deux types distincts parmi qatal, yiqtol, weqatal et wayyiqtol. Cette deuxième mesure est particulièrement importante pour la présente recherche, car elle indique que le corpus contient un grand nombre d’environnements où l’on peut observer le passage d’un régime verbal à un autre.

Graphique de densité d'alternance dans le corpus pilote
La densité d’alternance explique l’intérêt du corpus pilote : 126 unités contiennent au moins deux types distincts parmi les quatre formes principales.

La distribution par livres montre cependant que le corpus n’est pas équilibré. Les Psaumes et la Genèse y sont fortement représentés :

Livre Nombre d’unités sélectionnées
Psaumes 64
Genèse 46
Job 14
Exode 12
2 Samuel 12
1 Samuel 10
Juges 9
Proverbes 9
Deutéronome 8
1 Rois 7
Nombres 6
Josué 4
2 Rois 4
Lamentations 3
Qohélet 3
Lévitique 2
Isaïe 2
Cantique des cantiques 2
1 Chroniques 2
Jérémie 1
Michée 1
Ruth 1
2 Chroniques 1
Graphique de distribution du corpus pilote par livre
Le corpus pilote privilégie les Psaumes et la Genèse ; cette concentration confirme son statut typologique plutôt que statistiquement représentatif.

Ce déséquilibre n’est pas un défaut accidentel ; il détermine le statut méthodologique du corpus. Il serait incorrect de dire que ces 223 unités représentent statistiquement l’ensemble de la Bible hébraïque. Il est plus juste de dire qu’elles constituent un corpus pilote dense, sélectionné pour contenir des contextes narratifs, poétiques, projectifs, instructionnels et ambigus. Le corpus sert donc à construire une typologie, non à mesurer définitivement la fréquence de chaque opérateur dans tout le corpus biblique.

Cette distinction est centrale. Un corpus pilote peut être suffisant pour une recherche de master si son statut est clairement défini. Il permet de formuler des hypothèses, de tester une grille d’annotation, d’identifier des régularités et de préparer un élargissement ultérieur vers une base complète telle que BHSA / ETCBC.4. BHSA / ETCBC est mentionné comme horizon de généralisation : une telle base permettrait d’annoter systématiquement l’ordre des mots, le discours direct et les transitions sur l’ensemble du corpus biblique.

4.3. L’inventaire complet comme arrière-plan macrostatistique

À côté du corpus pilote, l’ancien travail contient un inventaire complet des formes verbales par livre biblique. Cet inventaire compte 72 397 formes verbales, réparties ainsi :

Forme Occurrences dans l’inventaire complet Pourcentage du total
qatal 14 696 20,3 %
yiqtol 15 967 22,1 %
weqatal 6 123 8,5 %
wayyiqtol 15 033 20,8 %
autres formes 20 578 28,4 %
total 72 397 100 %
Graphique de l'inventaire verbal global
Les quatre formes étudiées forment le noyau quantitatif de l’inventaire, mais leur fonction reste à déterminer par l’analyse clausale.

Cet inventaire n’est pas utilisé pour annoter directement les opérateurs discursifs, car il ne contient pas encore les informations syntaxiques et discursives nécessaires : type de clause, ordre des mots, discours direct, transition interclausale, topique, structure poétique. Il fournit cependant un arrière-plan indispensable. Il permet de voir que les quatre formes étudiées ne sont pas marginales : elles représentent ensemble environ 71,6 % des formes verbales recensées.

L’inventaire permet également d’observer des profils macroscopiques par livre ou par genre. Les livres narratifs tels que la Genèse, Josué, Juges, Samuel, Rois, Ruth, Jonas ou Chroniques présentent généralement une proportion élevée de wayyiqtol, ce qui correspond au rôle narratif de cette forme. Les livres légaux ou prescriptifs, notamment Exode, Lévitique, Nombres et Deutéronome, ainsi que certains livres prophétiques, donnent plus de poids au domaine yiqtol / weqatal, lié à la projection, à la norme, à l’instruction et à la conséquence. Les livres poétiques et sapientiaux, tels que Psaumes, Proverbes, Job, Cantique des cantiques, Qohélet et Lamentations, présentent souvent un profil dominé par qatal et yiqtol, avec une présence plus faible de wayyiqtol.

Ces profils peuvent être résumés de manière provisoire :

Profil macro Indice principal Livres ou ensembles typiques Interprétation de travail
narratif-séquentiel proportion élevée de wayyiqtol Genèse, Juges, Samuel, Rois, Ruth, Jonas ligne événementielle et progression narrative
projectif-normatif poids de yiqtol et weqatal Exode, Lévitique, Nombres, Deutéronome, Ézéchiel loi, instruction, prédiction, procédure
poétique-expositionnel qatal / yiqtol, faible wayyiqtol Psaumes, Job, Proverbes, Cantique, Qohélet parallélisme, gnomique, prière, exposition
lamentatif-rétrospectif proportion élevée de qatal Lamentations fixation du désastre, mémoire, plainte
Graphique empilé des profils verbaux par livre
Les profils par livre font apparaître la variation des régimes discursifs : forte part de wayyiqtol dans les livres narratifs, poids de yiqtol / weqatal dans plusieurs ensembles normatifs ou prophétiques, et présence accrue de qatal / yiqtol dans les livres poétiques.

Ces profils ne prouvent pas à eux seuls les fonctions discursives. Ils indiquent plutôt que la distribution des formes varie avec les régimes textuels. Ils justifient donc la stratégie du mémoire : il faut interpréter les formes en relation avec le genre et la structure discursive.

La visualisation ne constitue pas le cœur de l’argument ; elle sert de carte de lecture. Elle rend visibles les contrastes macrostatistiques que l’analyse qualitative devra ensuite expliquer, livre par livre et clause par clause.

4.4. Transitions entre formes dans le corpus pilote

L’un des intérêts principaux du corpus pilote est qu’il permet d’observer les transitions entre formes à l’intérieur d’une même unité textuelle.5. Les matrices de transitions ne remplacent pas l’analyse qualitative ; elles orientent la lecture vers les zones où une relation entre clauses devient observable. Pour le présent mémoire, ces transitions sont plus importantes que les fréquences isolées, car la question centrale porte sur les relations entre clauses.

La matrice suivante indique les transitions entre les quatre formes principales, telles qu’elles apparaissent dans l’ordre du texte à l’intérieur des unités sélectionnées :

De \ vers qatal yiqtol weqatal wayyiqtol Total ligne
qatal 59 20 12 32 123
yiqtol 21 77 30 18 146
weqatal 6 19 15 1 41
wayyiqtol 30 29 2 82 143
Carte de chaleur des transitions absolues entre formes principales
La matrice absolue met en évidence trois noyaux : auto-enchaînement de wayyiqtol, maintien de yiqtol, et bloc de factualité en qatal.

Les transitions les plus fréquentes sont les suivantes :

Transition Nombre Interprétation de travail
wayyiqtol -> wayyiqtol 82 chaîne narrative, progression événementielle
yiqtol -> yiqtol 77 projection, modalité, gnomique ou développement poétique
qatal -> qatal 59 bloc de factualité, commentaire, rétrospection ou parallélisme
qatal -> wayyiqtol 32 lancement ou reprise du mouvement narratif
wayyiqtol -> qatal 30 rupture, arrière-plan, commentaire ou rétrospection
yiqtol -> weqatal 30 séquence projective ou instructionnelle
wayyiqtol -> yiqtol 29 passage au discours, à la projection ou à un autre régime
yiqtol -> qatal 21 passage entre projection et fait, ou parallélisme
qatal -> yiqtol 20 projection après fait, généralisation ou parallélisme
weqatal -> yiqtol 19 alternance dans le domaine projectif
yiqtol -> wayyiqtol 18 retour à une séquence narrative ou transition de régime
weqatal -> weqatal 15 chaîne procédurale ou projective
Graphique des transitions les plus fréquentes dans le corpus pilote
Les transitions les plus fréquentes montrent que le corpus pilote contient à la fois des régimes stables et des passages mixtes entre narration, factualité et projection.

Ces chiffres ne doivent pas être interprétés comme une statistique définitive de la Bible hébraïque. Ils ont une autre fonction : ils montrent que le corpus est adapté à la question du mémoire. Les transitions les plus fréquentes correspondent précisément aux zones théoriques qui seront étudiées :

Les passages suivants servent de contrôle : Genèse 25.34a pour qatal -> wayyiqtol, Exode 20.9 pour yiqtol -> weqatal, et Psaume 40.2-4 pour une micro-chaîne liturgique où le récit est repris dans la prière.

Genèse 25.34a ID 693 · Gn 25-34a
וְיַעֲקֹ֞ב נָתַ֣ן לְעֵשָׂ֗ו לֶ֚חֶם וּנְזִ֣יד עֲדָשִׁ֔ים וַיֹּ֣אכַל וַיֵּ֔שְׁתְּ וַיָּ֖קָם וַיֵּלַ֑ךְ
wᵉ yaʿăqṓv nātán lᵉ ʿēśā́w ĺeḥem ū nᵉzī́d ʿădāšī́m wa-y-yṓxal wa-y-yḗšt wa-y-yā́qom wa-y-yēláx
Jacob servit à Ésaü du pain et un plat de lentilles; il mangea et but , se leva et ressortit .
qatal wayyiqtol
Exode 20.9 ID 2061 · Ex 20-9
שֵׁ֤֣שֶׁת יָמִ֣ים֙ תַּֽעֲבֹ֔ד֮ וְעָשִׂ֖֣יתָ כָּל־מְלַאכְתֶּֽךָ֒
šḗšet yāmī́m táʿăvṓd wᵉ ʿāśī́ kol-mᵉlaxté
Durant six jours tu travailleras et t’occuperas de toutes tes affaires,
yiqtol weqatal
Psaume 40.2-4 ID 15756 · Sl 40-2-4
(2) קַוֺּ֣ה קִוִּ֣יתִי יְהוָ֑ה וַיֵּ֥ט אֵ֝לַ֗י וַיִּשְׁמַ֥ע שַׁוְעָתִֽי׃ (3) וַיַּעֲלֵ֤נִי ׀ מִבּ֥וֹר שָׁאוֹן֮ מִטִּ֪יט הַיָּ֫וֵ֥ן וַיָּ֖קֶם עַל־סֶ֥לַע רַגְלַ֗י כּוֹנֵ֥ן אֲשֻׁרָֽי׃ (4) וַיִּתֵּ֬ן בְּפִ֨י ׀ שִׁ֥יר חָדָשׁ֮ תְּהִלָּ֪ה לֵֽאלֹ֫הֵ֥ינוּ יִרְא֣וּ רַבִּ֣ים וְיִירָ֑אוּ וְ֝יִבְטְח֗וּ בַּיהוָֽה׃
(2) qawwṓ qiwwī́ ʔăḏōnā́y wa-y-yḗ ʾ́ēláy wa-y-yišmáʿ šawʿātī́ (3) wa-y-yaʿălḗ mi-b-bṓr šāʾōn mi-ṭ-ṭī́ṭ ha-y-yā́́n wa-y-yā́qem ʿal-sélaʿ ragláy kōnḗn ʾăšurā́y (4) wa-y-yittḗn bᵉ fī́ šī́r ḥādāš tᵉhillā́́ ʾlṓ́yirʾū́ rabbī́m wᵉ yīrā́ʾū ẃ yivṭᵉḥū́ ba ʔăḏōnā́y
Je n’ai point fait le silence sur ta justice, dont mon cœur est plein; j’ai dit ta fidélité et ta protection; je n’ai point caché ta grâce et ta bienveillance à la grande foule.
infinitif qatal wayyiqtol yiqtol

La matrice de transitions servira donc de guide pour sélectionner les passages à analyser de manière détaillée. Les lectures rapprochées des chapitres 5 à 7 devront montrer ce que ces transitions accomplissent concrètement dans les textes.

4.5. Cooccurrence des formes

Les cooccurrences indiquent quelles formes apparaissent ensemble dans une même unité textuelle, indépendamment de leur ordre exact. Elles permettent d’identifier les zones de contact entre régimes.

Paire de formes dans une même unité Nombre d’unités
qatal + wayyiqtol 46
qatal + yiqtol 43
wayyiqtol + yiqtol 39
yiqtol + weqatal 34
qatal + weqatal 17
weqatal + wayyiqtol 7
Graphique des cooccurrences de formes principales
Les cooccurrences mesurent la proximité des formes dans une même unité textuelle ; elles signalent les zones de contact entre régimes.

Ces cooccurrences confirment que le corpus pilote n’est pas seulement riche en formes isolées, mais en alternances. Les paires qatal + wayyiqtol et wayyiqtol + yiqtol sont particulièrement importantes pour l’analyse narrative et le passage au discours direct. La paire yiqtol + weqatal est centrale pour le domaine projectif, instructionnel et conditionnel. La paire qatal + yiqtol sera décisive dans l’analyse poétique, où les deux formes peuvent former des parallélismes plutôt que s’opposer comme deux temps.

La cooccurrence ne suffit évidemment pas à déterminer la fonction. Deux formes peuvent apparaître dans la même unité sans être dans une relation directe. Mais elle fournit un premier indice de densité opératoire. Plus une unité contient de formes différentes, plus elle est susceptible de manifester un changement de régime : récit vers parole, fait vers projection, ligne principale vers commentaire, narration vers poésie.

4.6. Unité d’analyse : de l’unité textuelle à la clause

Le fichier bible-selected.csv est organisé par unités textuelles, mais l’unité analytique du mémoire est la clause.6. La segmentation clausale est le passage méthodologique décisif : un verset ou une ligne CSV peut contenir plusieurs opérations discursives distinctes. Cette distinction est importante. Une ligne du CSV peut contenir une seule clause, mais elle peut aussi contenir plusieurs clauses coordonnées, subordonnées, enchâssées ou poétiques. L’annotation devra donc passer d’une unité textuelle à une segmentation clausale.

Le protocole sera le suivant :

  1. identifier l’unité textuelle et sa référence biblique ;
  2. segmenter l’unité en clauses pertinentes ;
  3. attribuer un clause_id à chaque clause ;
  4. identifier la ou les formes verbales de chaque clause ;
  5. noter la forme précédente et la forme suivante dans la séquence locale ;
  6. déterminer l’ordre des mots et la présence éventuelle d’un constituant préverbal ;
  7. préciser le statut de la clause : récit, discours direct, subordonnée, condition, poésie ;
  8. attribuer un opérateur primaire et, si nécessaire, un opérateur secondaire ;
  9. noter le degré d’ambiguïté et les raisons de l’analyse.

Cette segmentation est particulièrement nécessaire dans les contextes suivants :

Contexte Risque si l’on reste au niveau du verset Décision méthodologique
récit avec plusieurs wayyiqtol confondre une chaîne avec une seule unité segmenter chaque clause événementielle
discours direct mélanger perspective du narrateur et du personnage annoter speech_status et speech_boundary
condition ne pas distinguer protase et apodose annoter clause_type et transition_type
poésie confondre verset et cola poétiques annoter bicolon / tricolon et relation poétique
clauses avec fronting perdre le diagnostic informationnel annoter word_order et fronting_type

Ainsi, le corpus pilote est un point de départ, non une annotation finale. Le travail du mémoire consiste à enrichir les données existantes par une annotation syntaxico-discursive.

4.7. Schéma d’annotation

Le schéma d’annotation reprend le modèle formulé au chapitre 3. Le futur fichier de travail sera data/operator-annotation.csv. Il devra contenir au minimum les champs suivants :

ref
book
chapter
verse
clause_id
hebrew_form
form_class
preceding_form
following_form
word_order
waw_presence
clause_type
speech_status
genre_macro
discourse_type
tam_primary
modality
operator_primary
operator_secondary
transition_type
topic_continuity
fronting_type
poetic_relation
root_semantics
ambiguity_level
notes
source_file

Les valeurs principales de form_class seront qatal, yiqtol, wayyiqtol, weqatal, participle, infinitive, imperative et other.

Les valeurs principales de word_order seront V1, SV, VS, XV, OV, ADV-V, NEG-V et unknown. Ce champ testera l’hypothèse selon laquelle la position de la forme dans la clause joue un rôle majeur dans l’interprétation discursive.

Les valeurs de transition_type seront notamment continuation, rupture, resumption, backgrounding, foregrounding, projection, explanation, condition, parallelism et speech_boundary.

Le champ operator_primary contiendra l’opérateur discursif principal : par exemple MAINLINE, BACKGROUND, RUPTURE, RESUMPTION, PROJECTION, CONDITION, INSTRUCTION, PROCEDURE, PARALLELISM ou COMMENT. Le champ operator_secondary permettra de noter les cas mixtes, par exemple une clause qui fonctionne à la fois comme BACKGROUND et FLASHBACK.

Le champ ambiguity_level distinguera trois niveaux : faible, moyen et élevé. Un niveau faible indique que plusieurs diagnostics convergent ; un niveau moyen indique une analyse probable mais non exclusive ; un niveau élevé indique que l’occurrence doit rester ouverte ou discutée dans les notes.

4.8. Limites et garanties méthodologiques

La première limite est la représentativité. Le corpus pilote est riche, mais il n’est pas équilibré par livre, par genre ou par période. Les Psaumes et la Genèse y occupent une place disproportionnée. Les conclusions issues de ce corpus devront donc être formulées comme des hypothèses typologiques et non comme des fréquences définitives pour toute la Bible hébraïque.

La deuxième limite concerne la segmentation. Le passage de l’unité textuelle à la clause exige des décisions interprétatives, surtout dans la poésie, le discours direct et les structures conditionnelles. Ces décisions devront être explicitées dans les notes d’annotation.

La troisième limite concerne l’ordre des mots. Les balises du fichier initial identifient les formes verbales, mais elles ne donnent pas automatiquement la structure de la clause. L’annotation du word order devra être faite manuellement, en tenant compte des constituants préverbaux, de la négation, des sujets explicites et des syntagmes adverbiaux.

La quatrième limite concerne les opérateurs eux-mêmes. Les catégories proposées dans le chapitre 3 sont des outils analytiques. Elles doivent rester contrôlées par les données. Si une occurrence ne peut pas être classée sans forcer l’interprétation, elle sera marquée comme ambiguë plutôt que réduite artificiellement à un opérateur unique.

Ces limites ne fragilisent pas la recherche ; elles définissent son statut. Le mémoire propose une typologie pilote vérifiable. Sa contribution réside moins dans une statistique finale que dans une méthode : montrer comment articuler forme verbale, clause, syntaxe, TAM, genre et relation discursive.

4.9. Passage aux analyses empiriques

Les données présentées dans ce chapitre orientent les analyses suivantes. La fréquence des transitions wayyiqtol -> wayyiqtol, wayyiqtol -> qatal et qatal -> wayyiqtol justifie de commencer par les opérateurs narratifs : chaîne, rupture, fond et reprise. Les transitions impliquant yiqtol et weqatal justifient ensuite l’analyse du domaine projectif : modalité, condition, instruction et procédure. Enfin, les cooccurrences qatal + yiqtol et la forte présence des Psaumes, de Job, des Proverbes et des Lamentations dans le corpus rendent nécessaire un chapitre consacré à la poésie, au parallélisme et aux opérateurs rhétoriques.

Le chapitre 5 analysera donc la relation entre wayyiqtol et qatal dans les contextes narratifs. Le chapitre 6 examinera le domaine yiqtol / weqatal dans les contextes de projection, de modalité et d’instruction. Le chapitre 7 montrera comment les mêmes formes se réorganisent en poésie, où les opérations discursives ne sont pas principalement séquentielles, mais paralléliques, rhétoriques, gnomiques ou liturgiques.

Références citées dans le chapitre

  1. Andersen, Francis I. The Sentence in Biblical Hebrew. La Haye, Mouton, 1974.
  2. Cook, John A. Time and the Biblical Hebrew Verb: The Expression of Tense, Aspect, and Modality in Biblical Hebrew. Winona Lake, Eisenbrauns, 2012.
  3. Goldfajn, Tal. Word Order and Time in Biblical Hebrew Narrative. Oxford, Clarendon Press, 1998.
  4. Longacre, Robert E., et Andrew C. Bowling. Understanding Biblical Hebrew Verb Forms: Distribution and Function Across Genres. Dallas, SIL International, 2015.
  5. Moshavi, Adina. Word Order in the Biblical Hebrew Finite Clause. Winona Lake, Eisenbrauns, 2012.
  6. Robar, Elizabeth. The Verb and the Paragraph in Biblical Hebrew. Leiden, Brill, 2014.
  7. WTT - Westminster Leningrad Codex. Philadelphia, Westminster Theological Seminary. BibleWorks 9.
  8. WTM - Groves-Wheeler Morphology and Lemma Database 4.10. Philadelphia, Westminster Theological Seminary, 2008. BibleWorks 9.
  9. historique/sources_originales/biblical-data/bible-selected.csv, corpus pilote annoté manuellement.
  10. historique/sources_originales/annexe_1.txt, inventaire complet des formes verbales par livre biblique.