La montée en puissance de l’IA générative soulève des questions majeures en matière de propriété intellectuelle. Comprendre ses définitions, en mesurer les enjeux et anticiper les risques juridiques devient un levier stratégique pour créer, entraîner et exploiter l’IA en toute conformité.
Qu’est-ce que la propriété intellectuelle ?
La propriété intellectuelle regroupe l’ensemble des droits qui protègent les créations : textes, images, logiciels, bases de données, etc.
Deux branches principales
- Propriété industrielle : protège les créations à caractère technique ou commercial (brevets, marques, dessins & modèles, indications géographiques, obtentions végétales, topographies de semi-conducteurs, etc.)
Exemple : dépôt d’un brevet sur une méthode de diagnostic médical automatisé par IA. - Propriété littéraire et artistique : protège les œuvres de l’esprit (droit d’auteur, droits voisins, droit sui generis des producteurs de bases de données, etc.)
Exemple : roman coécrit par un auteur et une IA, retravaillé de manière créative par l’humain.
Propriété intellectuelle & IA : panorama des droits concernés
Dans le domaine de l’IA, plusieurs branches de la propriété intellectuelle peuvent s’appliquer. Chacune prévoit des régimes de protection adaptés à la nature des composants concernés, qu’il s’agisse du modèle, des données ou des contenus générés.
1. Droit d’auteur
Le droit d’auteur est la branche du droit de la propriété intellectuelle qui protège les œuvres de l’esprit et confère à leur créateur un ensemble de droits exclusifs, à la fois moraux et patrimoniaux, sur l’exploitation de son œuvre.
Exemple : Une IA d’illustration entraînée sur des tableaux protégés par le droit d’auteur peut générer des images reprenant des éléments reconnaissables, exposant ainsi à un risque de violation. Sans autorisation préalable, l’utilisation de ces œuvres dans l’entraînement ou la génération peut constituer une contrefaçon, sauf exception légale.
2. Droit sui generis des bases de données
Le droit du producteur de bases de données, dit droit sui generis, est un droit spécifique prévu par le Code de la propriété intellectuelle qui protège l’investissement substantiel consenti pour la constitution, la vérification ou la présentation d’une base de données, indépendamment de l’originalité de son contenu.
Exemple : Une entreprise spécialisée en agriculture de précision collecte pendant 10 ans des données issues de capteurs, satellites et drones et entraîne un modèle d’IA capable de prédire les maladies des cultures.
Ces données sont rassemblées, nettoyées, structurées et stockées dans une base de données propriétaire qui a nécessité un investissement substantiel en moyens financiers, techniques et humains. Cette base est protégée par le droit sui generis, qui couvre l’obtention, la vérification ou la présentation des données.
3. Secret des affaires
Le secret des affaires est une notion juridique qui protège les informations stratégiques et confidentielles d’une entreprise contre l’obtention, l’utilisation ou la divulgation illicite par des tiers.
Exemple : Une start-up développe un modèle d’IA médical reposant sur un algorithme propriétaire, un jeu de données exclusif et un procédé innovant de prétraitement. Ces informations, ayant une valeur commerciale et protégées par des mesures de confidentialité, relèvent du secret des affaires.
4. Droit des marques
Le droit des marques est la branche du droit de la propriété intellectuelle qui encadre la création, l’enregistrement, l’utilisation et la protection des signes distinctifs servant à identifier les produits ou services d’une entreprise et à les distinguer de ceux de ses concurrents.
Une marque est un signe susceptible de représentation graphique ou de description claire et précise, servant à distinguer les produits ou services d’une personne physique ou morale.
Exemple : Une entreprise lance un assistant virtuel d’achat et dépose ce nom et son logo comme marque auprès de l’EUIPO. Le droit des marques lui accorde un usage exclusif pour les produits et services enregistrés et protège contre toute utilisation similaire créant une confusion.
5. Droit des brevets
Le droit des brevets est l’ensemble des règles juridiques qui régissent l’attribution, l’exploitation et la protection des brevets d’invention.
Le brevet est un titre de propriété industrielle délivré par une autorité compétente (par exemple, l’INPI en France, l’Office européen des brevets ou l’USPTO aux ÉtatsUnis) qui confère à son titulaire un droit exclusif sur une invention.
Exemple : Une société de medtech développe un algorithme d’IA innovant pour détecter précocement certains cancers à partir d’images IRM. Le brevet lui confère un monopole d’exploitation de 20 ans et protège contre toute utilisation non autorisée. Cette protection peut être valorisée commercialement via des licences accordées à d’autres acteurs.
Par ailleurs, selon la nature d’une œuvre ou d’une innovation, différentes protections peuvent s’appliquer simultanément. Plusieurs droits peuvent coexister sur une même création.
Par exemple, un logo peut être protégé par le droit d’auteur, mais également par le droit des marques.
Les différentes composantes de l’IA : quels régimes juridiques applicables ?
Avec la multiplication des affaires liés à l’IA en matière de propriété intellectuelle, il est essentiel de comprendre que l’IA ne constitue pas une entité homogène d’un point de vue juridique.
En réalité, elle se compose de plusieurs éléments distincts, et il est donc crucial pour l’opérateur concerné d’identifier précisément lequel est en cause afin de déterminer quel régime juridique est applicable en matière de propriété intellectuelle.
1. Le modèle/système d’IA lui-même
Ici, le système ou modèle d’IA est considéré en tant que bien immatériel, objet technique brevetable ou produit ou composant numérique.
Ex: Une entreprise développe un modèle ou un système d’IA.
- Droits applicables : brevet, droit d’auteur (code), secret des affaires
- Enjeux relatifs à la propriété intellectuelle : brevetabilité, protection du code source comme logiciel, avantage économique.
2. Les bases de données d’entraînement (corpus & fine-tuning)
Ici, on considère les données utilisées pour entraîner l’IA, comprenant généralement du texte, des images, de l’audio, de la vidéo, ou d’autres formats structurés ou non structurés.
Ex: Données variées : romans et nouvelles, articles de presse, peintures, dessins, morceaux enregistrés, partitions numérisées, cours boursiers, rapports annuels, indices économiques, tweets, posts LinkedIn, conversations publiques, etc.
- Droits applicables : droit d’auteur (sur œuvres du corpus), droit sui generis (structure/obtention), secret des affaires
- Enjeux relatifs à la propriété intellectuelle : licences, respect des exceptions, traçabilité des sources, opt-out TDM
3. Les outputs (résultats générés par IA)
Ici, on considère le résultat ou la réponse générée par le système, c’est-à-dire à une valeur représentant tout ou partie de l’opération effectuée par ce dernier à partir des données d’entrée.
Ex: Script complet d’un court-métrage produit par ChatGPT à partir du synopsis de l’auteur
- Droits applicables : droit d’auteur (si apport humain original), droits voisins/spécifiques selon pays, responsabilité vis-à-vis des droits de tiers.
- Enjeux relatifs à la propriété intellectuelle : risque de contrefaçon/plagiat si l’output reprend des éléments reconnaissables ; confusion/substitution.
Données d’entraînement et contenus générés : quels sont les risques en matière de propriété intellectuelle pour les utilisateurs d’IA ?
Les risques liés aux données d’entraînement
Les corpus utilisés pour entraîner un modèle peuvent contenir des œuvres protégées (textes, images, musiques, vidéos). Leur collecte par scraping ou par fouille de textes et de données (TDM) peut constituer un acte de reproduction nécessitant l’autorisation des ayants droit.
Même si une exception TDM est prévue en Europe, le mécanisme d’opt-out permet aux créateurs de s’opposer à l’utilisation de leurs œuvres. Le non-respect de ces oppositions expose les développeurs à des litiges pour violation de droits d’auteur.
Pour les utilisateurs d’IA, cela signifie qu’ils peuvent être exposés à des risques juridiques indirects si les modèles qu’ils emploient reposent sur des données collectées de manière illégale ou contestée.
Les risques liés aux contenus générés
Une IA peut produire des résultats qui reprennent le style, la composition ou des éléments reconnaissables d’œuvres existantes. Si la nature de l’œuvre générée n’est pas jugée suffisamment transformative, elle peut être considéré comme une contrefaçon. Le problème est accentué lorsque le contenu généré peut être perçu comme substituable à l’œuvre originale, ou lorsqu’il entretient une confusion dans l’esprit du public.
Pour les utilisateurs d’IA, cela implique un risque de voir leur utilisation de contenus générés donner lieu à des accusations de contrefaçon, y compris dans un cadre professionnel ou commercial, avec des conséquences financières et réputationnelles.
Ces risques rappellent que l’exploitation de l’IA nécessite une vigilance accrue et une gestion proactive de la propriété intellectuelle, afin de concilier innovation et respect des droits des créateurs.
Adoptez une gouvernance IA opérationnelle dès aujourd’hui
L’exploitation de l’IA exige une vigilance constante et une gestion rigoureuse de la propriété intellectuelle. Pour concilier innovation et respect des droits, il ne suffit pas d’une conformité théorique : il est nécessaire de mettre en place une gouvernance opérationnelle.
Découvrez la plateforme Naaia et planifiez une démo : Accéder à notre plateforme de management de l’IA