ISO 24617-8:2016
Gestion des ressources langagières -- Cadre d'annotation sémantique (SemAF) -- Partie 8: Relations sémantiques dans le discours, schéma d'annotation de base (DR-core)
détails du produit
L'ISO 24617-8:2016 fournit un socle d'annotation des relations du discours, en spécifiant un ensemble de base de relations du discours, un grand nombre d'entre elles revêtant des définitions similaires dans des cadres différents. Dans la mesure du possible, le présent document fournit des transpositions de sémantique dans les différents cadres existants.
L'ISO 24617-8:2016 peut être appliqué à deux situations différentes:
- pour l'annotation des relations du discours dans les corpus de langage naturel;
- en tant que représentation cible des méthodes automatiques d'analyse de surface du discours, pour le résumé automatique et autres applications.
Les objectifs de cette spécification sont de fournir:
- un ensemble de référence de catégories de données qui définissent une collection de types de relations du discours avec une sémantique explicite;
- une représentation pivot basée sur un cadre de définition des relations du discours qui peut faciliter la transposition entre différents cadres;
- une base d'élaboration de lignes directrices en vue de créer de nouvelles ressources qui seront immédiatement interopérables avec des ressources pré-existantes.
En ce qui concerne la structure du discours, la limite du présent document aux spécifications d'annotation de relations du discours locales, de «bas niveau», est fondée sur l'idée (a) que l'analyse à ce niveau correspond à ce qui est bien compris et peut être clairement défini, (b) qu'il est possible, s'il y a lieu, de procéder à des extensions complémentaires permettant de représenter une structure de discours globale de niveau plus élevé, et (c) qu'il permettra une compatibilité des annotations en découlant avec les divers cadres, même s'ils reposent sur des théories de structure du discours différentes.
En tant que partie intégrante du cadre d'annotation sémantique (SemAF) de l'ISO 24617, l'ISO 24617-8:2016 DR-core a pour objectif d'être transparente dans sa relation avec les cadres d'annotations des relations du discours existants, mais également d'être compatible avec les autres parties de l'ISO 24617. Certaines relations du discours sont spécifiques au discours interactif et recoupent la Partie 2 de l'ISO 24617 consacrée à l'annotation des actes de dialogue. D'autres relations du discours se rapportent au temps, et leur annotation fait partie intégrante de l'ISO 24617‑1 (temps et événements); d'autres relations du discours encore sont très semblables à certaines relations prédicat-argument («rôles sémantiques»), dont l'annotation est l'objet principal de l'ISO 24617‑4. Puisque les différentes parties sont indispensables pour constituer un ensemble cohérent, le présent document porte une attention particulière aux interactions de l'annotation des relations du discours avec les autres schémas d'annotation sémantique (voir Article 8).
L'ISO 24617-8:2016 ne traite pas de la représentation des structures de discours globales de niveau élevé, qui implique de relier des relations du discours locales pour constituer une ou plusieurs structures globales plus complexes.
L'ISO 24617-8:2016 se limite, en outre, aux relations strictement sémantiques, et exclut donc, par exemple, les relations présentationnelles, qui concernent la façon dont un texte est présenté à ses lecteurs ou la façon dont des locuteurs structurent leurs contributions à un dialogue oral.