banner

Nouvelles

Sep 28, 2023

Validation comparative de l'IA et non

Rapports scientifiques volume 13, Numéro d'article : 3439 (2023) Citer cet article

1082 accès

12 Altmétrique

Détails des métriques

Une correction de l'éditeur à cet article a été publiée le 03 mai 2023

Cet article a été mis à jour

La segmentation et la volumétrie automatisées des imageries cérébrales par résonance magnétique (IRM) sont essentielles pour le diagnostic de la maladie de Parkinson (MP) et des syndromes de Parkinson plus (P-plus). Pour améliorer les performances de diagnostic, nous adoptons des modèles d'apprentissage en profondeur (DL) dans la segmentation de l'IRM cérébrale et comparons leurs performances avec la méthode non-DL de référence. Nous avons recueilli des IRM cérébrales de témoins sains (\(n=105\)) et de patients atteints de MP (\(n=105\)), d'atrophie systémique multiple (\(n=132\)) et de paralysie supranucléaire progressive (\ (n = 69 \)) au Samsung Medical Center de janvier 2017 à décembre 2020. À l'aide du modèle non DL de référence, FreeSurfer (FS), nous avons segmenté six structures cérébrales : mésencéphale, pons, caudé, putamen, pallidum et troisième ventricule, et les a considérés comme des données annotées pour les modèles DL, les modèles représentatifs basés sur le réseau neuronal convolutif (CNN) et le transformateur de vision (ViT). Les scores des dés et l'aire sous la courbe (AUC) pour différencier les cas normaux, PD et P-plus ont été calculés pour déterminer la mesure dans laquelle les performances FS peuvent être reproduites telles quelles tout en augmentant la vitesse par les approches DL. Les temps de segmentation de CNN et ViT pour les six structures cérébrales par patient étaient respectivement de 51,26 ± 2,50 et 1101,82 ± 22,31 s, soit 14 à 300 fois plus rapides que FS (15 735 ± 1,07 s). Les scores aux dés des deux modèles DL étaient suffisamment élevés (> 0,85) pour que leurs ASC pour la classification des maladies ne soient pas inférieures à celles du FS. Pour la classification de normal vs. P-plus et PD vs. P-plus (sauf atrophie systémique multiple - type parkinsonien) basée sur toutes les parties du cerveau, les modèles DL et FS ont montré des ASC supérieures à 0,8, démontrant la valeur clinique des modèles DL en plus à FS. DL réduit considérablement le temps d'analyse sans compromettre les performances de la segmentation cérébrale et du diagnostic différentiel. Nos découvertes peuvent contribuer à l'adoption de la segmentation de l'IRM cérébrale DL dans les milieux cliniques et faire progresser la recherche sur le cerveau.

Le diagnostic de la maladie de Parkinson (MP) est principalement basé sur la présentation clinique. Cependant, pour les symptômes atypiques appelés drapeaux rouges1, l'imagerie par résonance magnétique (IRM) cérébrale est essentielle pour diagnostiquer les syndromes Parkinson-plus (P-plus), tels que l'atrophie multisystématisée (MSA) et la paralysie supranucléaire progressive (PSP). L'IRM améliore la précision du diagnostic et peut être utilisée pour surveiller la progression de la maladie2. L'IRM cérébrale peut révéler diverses caractéristiques qui apparaissent dans P-plus mais pas dans PD2,3,4. Par exemple, les patients atteints de PSP présentent une atrophie marquée du mésencéphale5, connue sous le nom de signe du colibri. Dans le type MSA-Parkinsonien (MSA-P), le putamen est atrophique, avec un bord latéral aplati, et présente un signal hypointense sur les images en écho de gradient pondérées en T1. Les patients atteints de type MSA-cérébelleux (MSA-C) présentent une atrophie prédominante du pont et des pédoncules cérébelleux moyens, entraînant une augmentation du rapport mésencéphale/pons6 et une diminution de l'indice de résonance magnétique parkinsonien7. En conséquence, des mesures quantitatives du volume de ces structures cérébrales ont également été évaluées, montrant une sensibilité et une spécificité élevées pour différencier la MP de P-plus8.

Bien que la sensibilité et la spécificité diagnostiques obtenues en évaluant la zone du mésencéphale soient généralement élevées pour différencier PSP, MSA et PD9, l'évaluation visuelle de cette zone n'est pas quantitative, manque d'objectivité et dépend fortement des compétences du médecin ou de l'acquisition d'images. Par conséquent, les diagnostics basés sur des évaluations visuelles ont montré un large spectre de précision, tombant même en dessous de 80 %10,11,12. Pour développer une analyse cohérente et quantitative de l'IRM cérébrale, la volumétrie de la région du mésencéphale a été utilisée comme prédicteur optimal pour un diagnostic précis6,8,13,14. Ainsi, la segmentation des images cérébrales est devenue une étape importante dans la plupart des analyses en aval basées sur des modèles de prédiction ou des méthodes d'apprentissage automatique (ML) pour la volumétrie et le diagnostic.

La segmentation manuelle des IRM cérébrales par un médecin formé est ardue et prend du temps, et elle nécessite un spécialiste hautement qualifié pour identifier correctement les structures cérébrales. Diverses techniques automatisées utilisant des techniques d'atlas ou d'apprentissage en profondeur (DL) ont été développées pour surmonter ces problèmes. Bien que les modèles de segmentation d'image automatisés pour le cerveau présentent des limites15,16, FreeSurfer (FS)17 peut extraire des structures cérébrales avec une précision relativement élevée. Par conséquent, FS a été largement adopté comme méthode de segmentation automatisée non DL17,18,19,20,21.

Diverses méthodes de segmentation automatisées pour les structures cérébrales ont été développées, mais leur utilisation dans la pratique clinique est limitée, étant généralement utilisée dans des études ponctuelles. Cela est attribuable au processus long et complexe des modèles de segmentation automatisés par rapport aux simples évaluations visuelles des examens IRM du cerveau par les médecins. Par exemple, le FS automatisé pour la segmentation prend plus de 4,5 h par patient pour segmenter le cerveau capturé dans une IRM. Ce problème de complexité se produit parce que les méthodes de segmentation automatisées existantes utilisent un enregistrement basé sur un atlas22,23,24,25. En fait, exprimer la segmentation comme un problème d'enregistrement basé sur l'atlas nécessite un temps considérable, et FS doit être optimisé pour obtenir une fonction de transformation de coordonnées adaptée au modèle d'atlas interne de chaque échantillon de test.

Un modèle automatisé pour une segmentation et un diagnostic rapides sans impliquer de méthodes complexes devrait être développé pour une utilisation clinique. Bien que la segmentation DL ait été développée et utilisée dans divers domaines, y compris la segmentation cérébrale26,27,28, des études sur l'efficacité et la précision de la segmentation des parties spécifiques de l'IRM cérébrale (par exemple, la séparation du mésencéphale et du pont pour le pipeline de la sous-structure du tronc cérébral) de maladies neurodégénératives spécifiques progresse encore. Contrairement aux méthodes non DL existantes, DL peut augmenter la vitesse d'analyse en complétant la segmentation en utilisant uniquement des calculs directs basés sur des paramètres appris sans nécessiter de processus d'optimisation tels que l'enregistrement. Cependant, il est difficile de prédire si DL présente une dégradation des performances par rapport aux méthodes non-DL, en particulier dans la segmentation de l'IRM cérébrale des maladies neurodégénératives. Notre étude est importante car elle démontre les performances comparatives des méthodes DL et non DL dans la segmentation de l'IRM cérébrale et les applique au diagnostic des maladies parkinsoniennes. En d'autres termes, cette étude a franchi une étape supplémentaire en montrant le diagnostic différentiel des maladies parkinsoniennes à l'aide de la segmentation cérébrale par des modèles IA et non IA, et non simplement en comparant les performances de la segmentation entre les modèles IA et non IA comme les études précédentes26.

Les modèles récents de segmentation DL sont classés en architectures de réseau neuronal convolutif (CNN) et de transformateur de vision (ViT). En conséquence, un modèle représentatif de chaque cadre, V-Net29 et transformateur UNet (UNETR)30, respectivement, a été adopté pour effectuer une segmentation d'image 3D volumétrique dans cette étude. Les modèles DL ont été formés pour segmenter les structures cérébrales sur les IRM pour le diagnostic des maladies neurodégénératives, et leurs performances ont été analysées et comparées avec un modèle non-DL existant, FS. Six structures cérébrales importantes pour classer les cas normaux, PD et P-plus ont été segmentées : putamen, pallidum, mésencéphale, pons, caudé et troisième ventricule. Les volumes des zones segmentées ont ensuite été utilisés pour différencier les cas normaux, PD et P-plus. Comme illustré à la Fig. 1, nous avons comparé la précision de différenciation de la maladie et le temps de segmentation des modèles DL avec ceux de FS, qui étaient considérés comme la référence (c'est-à-dire la vérité terrain) pour l'entraînement des modèles de segmentation DL. Par conséquent, les principales contributions de notre étude à partir de cette analyse comparative sont les suivantes : (1) Nous démontrons que les modèles DL de référence peuvent réduire considérablement le temps d'inférence FS sans compromettre les performances de diagnostic (tableau 1) et reproduire avec succès les résultats de segmentation des parties cérébrales de FS dans les maladies neurodégénératives (Fig. 2), (2) Par conséquent, nous montrons que DL permet une segmentation beaucoup moins complexe et un diagnostic automatique comparable des maladies neurodégénératives que l'approche actuelle non-DL (Tableaux 2 et 3), promettant l'utilisation pratique de la segmentation de l'IRM cérébrale basée sur la DL dans le diagnostic ou l'étude des maladies neurodégénératives (par exemple, diagnostic différentiel entre les cas PD, P-plus et normaux).

Aperçu de l'étude. Les performances diagnostiques du syndrome parkinsonien concernant le temps d'analyse et la précision de l'extraction et de la segmentation des structures cérébrales ont été comparées entre les modèles DL et FS. Le diagnostic de la maladie a été effectué en utilisant les structures extraites individuellement ou globalement.

Le tableau 1 répertorie le temps nécessaire pour segmenter les six structures cérébrales par patient. Comme mentionné dans la section "Segmentation de la structure cérébrale : ligne de base avec FS", le FS traite séquentiellement le reste du pipeline recon-all et le pipeline complet de la sous-structure du tronc cérébral. Dans le temps de segmentation FS, nous avons supprimé le temps consommé pour le prétraitement (c'est-à-dire l'extraction de l'image crânienne dépouillée de l'IRM d'origine) décrite dans la section "Segmentation de la structure cérébrale : ligne de base avec FS". Le temps qui en résulte fournit une comparaison équitable des temps totaux, car les modèles FS et DL utilisent l'IRM à rayures crâniennes comme entrée pour dériver les résultats finaux de la segmentation, indiqués par des valeurs en gras dans le tableau 1. Lors de l'inclusion du temps de prétraitement, CNN -basé sur V-Net et UNETR basé sur ViT étaient respectivement 14 et 7 fois plus rapides que FreeSurfer.

(a) Résultats de segmentation de V-Net basé sur CNN (images 3D de gauche dans la première colonne et zones surlignées en rouge dans la deuxième colonne) et FS (images 3D de droite dans la première colonne et zones surlignées en bleu dans la deuxième colonne) pour chaque structure cérébrale . ( b ) Résultats de segmentation de l'UNETR basée sur ViT (images 3D gauches dans la première colonne et zones surlignées en rouge dans la deuxième colonne) et FS (images 3D droites dans la première colonne et zones surlignées en bleu dans la deuxième colonne) pour chaque structure cérébrale.

Pour comparer avec le temps de traitement FS, nous avons ajouté du temps pour l'utilisation du processeur dans les modèles DL. Le V-Net basé sur CNN et l'UNETR basé sur ViT sont considérablement plus rapides que FS. En moyenne, V-Net a pris 3,48 s pour segmenter les six structures cérébrales, et UNETR a pris 48,14 s en utilisant le GPU et 51,26 s et 1101,82 s en utilisant le CPU, alors que FS a pris environ 15 735 s en utilisant le CPU, soit environ 307 et 14 fois plus lent que V -Net et UNETR, respectivement. Malgré le calcul du temps à l'aide du processeur, les modèles DL étaient plus rapides que FS de 14 à 300 fois. Non seulement les modèles DL basés sur GPU, mais les modèles DL utilisant le processeur ont également démontré des performances significatives par rapport à la méthode non IA (c'est-à-dire FS).

Les résultats de segmentation et de prédiction de V-Net, UNETR et FS sont illustrés à la Fig. 2. Le score Dice a été obtenu (tableau supplémentaire S1) pour évaluer les performances de la segmentation d'images 3D. Les modèles basés sur CNN et ViT ont montré des scores Dice élevés supérieurs à 0,85 pour toutes les structures cérébrales. Les scores de Dice étaient plus élevés pour le mésencéphale et le pont que pour les noyaux gris centraux (caudé, putamen, pallidum), peut-être parce que les troncs cérébraux sont entourés de liquide céphalo-rachidien et offrent un contraste plus fort pour une segmentation précise. Le modèle basé sur ViT a montré un score Dice plus élevé que le modèle basé sur CNN, qui à son tour a montré un temps de segmentation beaucoup plus court que le modèle basé sur ViT (par exemple, 51,26 s pour V-Net et 1101,82 s pour UNETR, comme indiqué dans Tableau 1). Bien que nous ayons évalué V-Net et UNETR dans différents environnements de développement de TensorFlow et PyTorch, respectivement, nous nous attendons à ce que le V-Net basé sur CNN soit compétitif en vitesse avec l'UNETR basé sur ViT étant donné la différence de vitesse de segmentation d'au moins 10 fois dans nos expériences. De plus, le V-Net basé sur CNN avait une performance similaire à l'UNETR basée sur ViT dans la classification réelle des maladies, comme indiqué dans le tableau 2.

En utilisant les volumes estimés, nous avons effectué une classification binaire pour les cas normaux contre P-plus, normaux contre PD et PD contre P-plus, où P-plus comprenait les cas PSP, MSA-P et MSA-C. Les ASC des structures cérébrales pour chaque modèle ont été comparées, comme indiqué dans le tableau 2, qui présente également l'ASC du rapport mésencéphale-pons31.

Parmi les 98 cas (7 cas de classification binaire × 2 modèles DL × 7 cas de structures cérébrales), il n'y avait pas de différence significative d'AUC entre les modèles DL et FS, à l'exception de 11 cas (c'est-à-dire les cas où la valeur de p est moins de 0,05). Dans plus de la moitié des 11 cas (c'est-à-dire 7 cas), les AUC des modèles DL (c'est-à-dire V-Net basé sur CNN et UNETR basé sur ViT) n'étaient pas inférieures à celles du FS. Ce résultat a démontré que le modèle DL reproduit avec succès les performances du modèle FS (c'est-à-dire qu'il obtient une performance similaire à celle du FS). En outre, la plupart des cas pour le V-Net basé sur CNN n'ont montré aucune ASC inférieure pour la classification des maladies que les cas pour l'UNETR basée sur ViT.

Les ASC les plus élevées dans la comparaison entre les méthodes étaient plus élevées chez les patients normaux ou PD vs MSA-C (0,91–0,94) que chez les patients normaux ou PD vs PSP (0,75–0,89). Parmi les structures cérébrales, le rapport mésencéphale/pons a montré les meilleures performances en normal vs MSA-C et PD vs MSA-C, tandis que le troisième ventricule et le pallidum ont montré les meilleures performances en normal vs PSP et PD vs MSA-C. PSP. Les ASC les plus élevées n'étaient pas significativement différentes dans la classification de normal ou PD par rapport à MSA-P (0,69–0,73) ou PD (0,63).

La plupart des AUC des modèles DL n'étaient pas significativement différentes de celles de FS, comme indiqué dans le tableau 3, bien qu'une différence considérable existait dans la vitesse de segmentation entre les modèles et FS, comme indiqué dans le tableau 1. Dans le tableau 3, l'AUC la plus élevée de Les modèles FS et DL pour chaque classification binaire sont indiqués en gras. Les AUC de classification les plus élevées entre PD vs P-plus et normal vs P-plus étaient supérieures à 0,8 dans les deux modèles DL, sauf pour PD vs MSA-P (AUC > 0,76). Il n'y avait pas de différence significative entre les modèles FS et DL (valeur p de 0,05 ou plus) dans toutes les ASC les plus élevées.

Le tableau 3 montre que sur les 28 cas (2 modèles ML × 2 modèles DL × 7 classifications binaires), la plupart des cas (c'est-à-dire 24 cas) n'avaient pas de différences significatives avec FS (c'est-à-dire avec des valeurs de p supérieures à 0,05), prouvant le succès reproductibilité des performances des modèles FS par DL. Comme indiqué dans le tableau 2, le V-Net basé sur CNN a obtenu une meilleure AUC que l'UNETR basée sur ViT ; dans 9 des 14 paires de cas, le V-Net basé sur CNN a surpassé l'UNETR basé sur ViT. D'après les résultats de LR et de XGBoost, nous confirmons que la prise en compte des six structures cérébrales (tableau 3) a entraîné une ASC significativement plus élevée que lors de la prise en compte des structures individuelles (tableau 2).

Nous avons développé deux modèles DL, V-Net et UNETR, qui ont montré une segmentation cérébrale significativement plus rapide que FS et une précision comparable. Nos modèles DL ont raccourci le temps de segmentation de 14 à 300 fois par rapport à FS. De plus, ils ont montré des performances élevées et robustes dans le diagnostic différentiel entre les cas de MP et de P-plus en utilisant le volume des structures cérébrales segmentées. Les modèles DL étaient efficaces (c'est-à-dire, vitesse d'analyse 14 à 300 fois plus rapide que FS) et efficaces (c'est-à-dire comparables à FS dans le score Dice et AUC) dans la segmentation cérébrale automatisée et le diagnostic des maladies, même pour l'analyse simultanée de toutes les structures cérébrales et de leur analyses individuelles. Ainsi, les modèles DL proposés peuvent promouvoir l'application de la segmentation cérébrale automatisée dans la pratique clinique et faciliter une recherche cérébrale efficace et précise en médecine.

Les outils automatisés ont rarement été adoptés pour la segmentation cérébrale dans la pratique clinique malgré leur grande précision dans le diagnostic différentiel des patients atteints de parkinsonisme13,16. Cela est principalement attribuable au processus compliqué et chronophage de segmentation cérébrale automatisée par rapport à l'évaluation visuelle qualitative des examens IRM du cerveau par les médecins. Par conséquent, les modèles de segmentation automatisés ont été principalement utilisés dans des contextes de recherche nécessitant des mesures quantitatives du cerveau. Néanmoins, leur application en milieu clinique peut augmenter avec nos modèles DL, qui ont montré une segmentation beaucoup plus rapide que FS avec une précision similaire. Les modèles DL peuvent contribuer à améliorer la précision du diagnostic clinique des cas de MP ou P-plus en fournissant une analyse précise de l'image cérébrale. De plus, les essais cliniques qui nécessitent une mesure quantitative du cerveau d'une grande population peuvent être facilement menés à l'aide de nos modèles DL rapides et précis. Dans le passé, les méthodes d'analyse d'images cérébrales prenaient beaucoup de temps et de ressources, même avec un outil de segmentation automatisé tel que FS.

Alors que V-net et UNETR ont montré une segmentation nettement plus rapide dans le CPU et le GPU, avec une précision satisfaisante, le V-Net basé sur CNN peut être plus approprié dans les contextes cliniques pour un diagnostic basé sur la volumétrie des IRM cérébrales. Notez que le temps a été calculé sans le temps de prétraitement pour l'équité de la mesure du temps. Le temps de segmentation de FreeSurfer correspond au temps nécessaire à la segmentation basée sur l'enregistrement pour le pipeline recon-all et le pipeline des sous-structures du tronc cérébral (Fig. S1 supplémentaire). Même si le temps de prétraitement est calculé, V-Net basé sur CNN et UNETR basé sur ViT étaient respectivement 14 et 7 fois plus rapides que FreeSurfer. Bien que l'UNETR basé sur ViT soit le modèle DL le plus récent et affiche un score Dice élevé, le nombre de paramètres d'entraînement est environ 46 fois plus élevé que celui de V-Net. Comme présenté dans le tableau 1, l'utilisation du processeur peut prendre 14 à 22 fois plus de temps. Cependant, il est évident que par rapport au temps de segmentation FS, le temps de traitement des modèles DL est plus rapide et a des performances équivalentes avec FS. À mesure que le nombre de calculs augmente avec le nombre de paramètres pouvant être entraînés, les exigences matérielles augmentent en termes de mémoire et de puissance de traitement de l'unité de traitement graphique (GPU). Par conséquent, l'UNETR basée sur ViT peut être considérablement exigeante pour la formation et l'évaluation, nécessitant un GPU de haute spécification. Le V-Net basé sur CNN a montré une AUC généralement supérieure à celle de l'UNETR et des scores Dice inférieurs. Jusqu'à ce que les performances de ViT soient encore améliorées, le V-Net basé sur CNN, qui utilise moins de ressources GPU, semble être la meilleure option pour la pratique clinique.

En utilisant des approches basées sur l'apprentissage automatique de référence, nous avons montré l'AUC du diagnostic basé sur la segmentation de FreeSurfer et la segmentation de la méthode DL pour montrer qu'il n'y a pas de différence significative entre les résultats de segmentation des modèles FreeSurfer et DL. Comme nos modèles DL sont 14 à 300 fois plus rapides que FS sans sacrifier les performances diagnostiques, ils sont supérieurs à FS en termes d'efficacité clinique. Dans la classification binaire utilisant des structures cérébrales individuelles, l'ordre relatif de l'AUC de chaque structure cérébrale était cohérent avec les résultats précédemment rapportés10,32. Par exemple, le rapport pons et mésencéphale à pons a montré l'ASC la plus élevée dans la classification des cas normaux par rapport à MSA-C et PD par rapport à MSA-C. Le troisième ventricule et le pallidum ont montré l'ASC la plus élevée dans la classification des cas normaux contre PSP et PD contre PSP. Le putamen a montré l'ASC la plus élevée dans la classification des cas de MP et de MSA-P. Dans la classification des cas PD vs PSP, le troisième ventricule a montré une AUC plus élevée, tandis que le mésencéphale a montré une AUC relativement plus faible. Des mesures uniques du mésencéphale n'ont pas permis de différencier la PSP de la MP ou de la MSA33,34,35, malgré les études IRM classiques montrant un mésencéphale atrophique dans la PSP7,11. D'autre part, le troisième ventricule s'est avéré être un marqueur fiable pour diagnostiquer la PSP de stade précoce à partir de la MP et de PSP de stade avancé36, et il a été ajouté à une nouvelle version de l'indice de résonance magnétique parkinsonienne37.

Pour la classification binaire basée sur les six structures cérébrales, des améliorations significatives de l'ASC ont été obtenues dans tous les modèles. Dans les deux modèles DL, l'ASC la plus élevée de la classification des cas PD vs P-plus et normal vs P-plus était supérieure à 0,8, sauf pour les cas PD vs MSA-P. L'ASC relativement faible de la classification entre les cas de MP et de MSA-P basée sur les cas d'IRM cérébrale a également été rapportée dans des études antérieures10,32. La limitation du diagnostic clinique peut avoir contribué aux ASC relativement faibles dans ces études en raison des manifestations qui se chevauchent entre les cas de MP et de MSA-P. Il a été rapporté que le diagnostic clinique de PSP et de MSA-P présentait la divergence la plus fréquente par rapport au diagnostic prouvé par autopsie, même en tenant compte des critères de diagnostic38. Aucune différence significative dans les IRM cérébrales n'a été trouvée entre les cas normaux et les cas de MP, ce qui n'entraîne aucune différence significative d'AUC pour la classification entre ces cas.

Notre étude comporte certaines limites. Premièrement, les diagnostics de MP, PSP et MSA-C n'ont pas été vérifiés sur le plan pathologique. Au lieu de cela, les spécialistes du mouvement ont fourni des diagnostics cliniques basés sur un consensus clinique validé, ne fournissant qu'un diagnostic probable. Deuxièmement, nous avons segmenté six structures cérébrales, à savoir le mésencéphale, le pons, la moelle épinière, le putamen, le pallidum et le troisième ventricule, mais nous avons ignoré les autres structures cérébrales pouvant refléter différentes caractéristiques pathologiques entre la MP et le P-plus (par exemple, le cervelet, le pédoncule cérébelleux moyen) . Nous avons exclu ces structures en raison de la faible précision de segmentation obtenue par FS. De plus, les méthodes DL apprennent les caractéristiques grossières en priorité car elles constituent la région commune des données d'apprentissage, qui sont des régions à basse fréquence. Cela se traduit par une image plus lisse que celle de FS, atténuant les artefacts mineurs des images sur les bords extérieurs. Cependant, dans le cas du cervelet où des changements plus petits sont essentiels, une étude plus spécifique est nécessaire pour savoir si nos méthodes DL seront applicables à la segmentation des petits gyri du cervelet, en les comparant à la segmentation manuelle du cervelet. Néanmoins, le diagnostic différentiel de P-plus utilisant uniquement les structures cérébrales incluses dans cette étude a été rapporté comme fiable31. Troisièmement, étant donné les limitations de mémoire, nous avons réduit la forme de sortie de \(256 \times 256 \times 256\) à \(256 \times 256 \times 128\), ce qui peut avoir causé une perte d'informations. Néanmoins, les scores Dice suggèrent un impact négligeable de la perte d'informations, alors que l'utilisation d'une entrée réduite accélère la formation et l'inférence dans les modèles DL. Quatrièmement, FreeSurfer ne prend pas en charge le GPU (c'est-à-dire CUDA) pour la segmentation, ce qui rend difficile la comparaison du temps entre les modèles DL. Nous avons calculé le temps de segmentation à l'aide du processeur et concluons toujours que les modèles DL sont 14 à 300 fois plus rapides.

La segmentation automatisée des IRM cérébrales est devenue une méthode influente pour diagnostiquer les maladies neurodégénératives, y compris les troubles du mouvement. En utilisant les modèles hautes performances basés sur CNN et ViT, nous avons considérablement raccourci le temps de segmentation des structures cérébrales profondes tout en obtenant une précision comparable à la segmentation FS conventionnelle. Malgré les performances supérieures du DL, aucun résultat quantitatif de l'analyse comparative et de l'évaluation des performances du DL n'a été rapporté à ce jour pour le diagnostic différentiel des maladies neurodégénératives, y compris la MP et le P-plus. Nous avons constaté que le modèle rentable basé sur CNN atteint des performances satisfaisantes à la fois dans la segmentation et le diagnostic différentiel par rapport au modèle basé sur ViT le plus récent. Nos modèles DL peuvent contribuer au développement de méthodes de segmentation conviviales pour les patients et les cliniciens qui permettent un diagnostic rapide et précis et peuvent fournir une référence significative pour les hôpitaux qui envisagent d'introduire la segmentation cérébrale DL et le diagnostic des maladies neurodégénératives.

Cette étude se concentre sur la comparaison si l'IA est plus efficace dans les performances de diagnostic que la méthode non-IA représentative existante. Par conséquent, comme l'objet de cette étude est de comparer les techniques, la comparaison avec les cliniciens n'a pas été effectuée dans cette étude. Ce serait une future étude prometteuse de comparer la précision du diagnostic entre les méthodes d'apprentissage automatique et les cliniciens.

Dans cette section, nous décrivons les données d'IRM cérébrales (Section "Préparation des données"), la mise en œuvre de FS (Section "Segmentation de la structure cérébrale : ligne de base avec FS") et la mise en œuvre de la méthode DL (Section "Modèles DL pour la segmentation de la structure cérébrale") pour le analyse volumétrique des structures cérébrales clés pour diagnostiquer les maladies neurodégénératives. La figure 1 montre un aperçu du processus d'étude compte tenu de l'évaluation et des comparaisons entre les modèles FS et DL (c'est-à-dire, V-Net et UNETR modifiés représentant respectivement les architectures CNN et ViT DL). La figure supplémentaire S1 montre un diagramme de la comparaison des performances globales. Nous avons développé des modèles DL avec un traitement plus rapide mais des performances de segmentation similaires à FS. Les modèles DL ont été formés pour reproduire et segmenter les résultats de FS pour chaque structure cérébrale \(F_i \in [0,1]^{256 \times 256 \times 128}\) comme sortie du modèle \(V_i \in [0, 1]^{256 \times 256 \times 128}\) en prenant comme entrée (\(i \ dans \{pallidum, \, putamen, \, caudé, \, troisième \, ventricule, \, mésencéphale, \, pons \}\)), avec résolution (h, w, d) (hauteur \(h=256\ ), largeur \(l=256\), profondeur \(d=128\)). Les résultats de la segmentation DL pour les six structures cérébrales ont été stockés sous forme de masques binaires 3D (\(F_i\) et \(V_i\) indiquent respectivement les masques des modèles FS et DL pour la structure cérébrale i), où chaque sortie de masque contenait des intensités entre 0 et 1 (zone à l'extérieur et à l'intérieur de la structure cérébrale cible, respectivement). En calculant le volume absolu de chacune ou de toutes les structures cérébrales prédites par les modèles FS ou DL, nous avons effectué une classification binaire des cas PD, MSA-C, MSA-P, PSP et normaux, et calculé l'aire sous la courbe (AUC) de segmentation.

Tous les auteurs de cette étude confirment que toutes les méthodes ou expériences ont été réalisées conformément à la Déclaration d'Helsinki et aux directives et réglementations pertinentes fournies par les politiques des revues Nature Portfolio. Cette étude a été approuvée par l'Institutional Review Board du Samsung Medical Center (numéro IRB : SMC 2021-07-026). Le consentement éclairé écrit des patients a été annulé par le comité d'examen institutionnel du centre médical Samsung, car nous avons utilisé des données anonymisées et rétrospectives.

Nous avons rétrospectivement examiné les patients du service de neurologie du Samsung Medical Center entre janvier 2017 et décembre 2020. Les patients diagnostiqués avec une MP, une MSA probable ou une PSP probable ont été inclus dans cette étude. Le diagnostic de chaque patient a été déterminé par des spécialistes des troubles du mouvement sur la base des critères suivants : la MP a été déterminée selon les critères de la United Kingdom PD Society Brain Bank39 en utilisant [18F] N-(3-fluoropropyl)-2β-carbon ethoxy-3β-( tomographie par émission de positrons au 4-iodophényl) nortropane, tandis que les MSA et PSP probables ont été diagnostiqués selon le deuxième diagnostic consensuel de MSA40 et les critères de diagnostic clinique de la société des troubles du mouvement pour PSP41, respectivement. Les cas d'AMS ont ensuite été classés comme MSA-P ou MSA-C après avoir atteint un consensus40. Les patients présentant des lésions cérébrales concomitantes ou structurelles, y compris des accidents vasculaires cérébraux et des tumeurs, qui peuvent affecter les IRM cérébrales, ont été exclus de l'étude. Une population âgée en bonne santé appariée selon l'âge a été incluse comme groupe témoin. Les informations démographiques sur l'âge, le sexe et la durée de la maladie jusqu'à la collecte de l'examen IRM du cerveau, comme indiqué dans le tableau 4. Nous avons analysé les données de 411 personnes et effectué une triple validation croisée pour former et évaluer les modèles DL. Chaque groupe était composé de 105 témoins sains et de 105 cas de MP, 69 PSP, 69 MSA-C et 63 cas de MSA-P.

Nous avons appliqué une validation croisée avec trois plis externes pour l'évaluation afin d'atténuer les biais dans les ensembles de validation et de test et d'analyser l'effet de la composition de l'ensemble (combinaisons de cas en groupes). Les données ont été divisées au hasard en trois sections, une pour les tests et deux pour la formation. Chaque groupe comprenait 35 cas normaux, 35 PD, 23 PSP, 23 MSA-C et 21 cas MSA-P.

Les IRM cérébrales axiales ont été acquises à l'aide d'un protocole standard pour l'acquisition rapide de l'écho de gradient préparé par magnétisation T1, avec un temps de répétition/écho de 11 000/125 ms, un temps d'inversion de 2 800 ms, un champ de vision de 240 mm, une taille de matrice d'acquisition de \(320 \times 249\), longueur de train d'écho de 27, 1 signal moyen, épaisseur de tranche de 5 mm, écart entre les tranches de 1,5 mm et temps de balayage de 198 s.

Nous avons inclus six structures cérébrales impliquées dans les syndromes parkinsoniens de la matière grise, à savoir le mésencéphale, le pont, le putamen, le pallidum, le caudé et le troisième ventricule. Ces zones sont signalées comme ayant la sensibilité et la spécificité les plus élevées pour différencier les syndromes parkinsoniens13,16. Les scans IRM ont été redimensionnés à \(256 \fois 256 \fois 128\) (c'est-à-dire le nombre de tranches dans les plans coronal/sagittal/axial) pour segmenter chaque structure.

Le FS accepte les fichiers Digital Imaging and Communications in Medicine (DICOM) ou Neuroimaging Informatics Technology Initiative (NIfTI) comme entrées. DICOM est un format convaincant et flexible mais complexe qui offre une interopérabilité entre plusieurs outils matériels et logiciels. Compte tenu de sa complexité, le format DICOM a été converti au format NIfTI42. NIfTI est un format plus simple que DICOM et préserve les métadonnées essentielles. De plus, il conserve le volume en tant que fichier unique et utilise des données brutes après un en-tête simple, et les fichiers NIfTI peuvent être chargés et traités plus rapidement que les fichiers DICOM pour les images du cerveau entier. Par conséquent, nous avons converti des fichiers au format DICOM d'IRM cérébrale en fichiers au format NIfTI à l'aide de MRIcroGL.

L'extraction des structures cérébrales obtenues à l'aide de la segmentation automatisée basée sur l'atlas est nécessaire pour la formation et la validation avant d'établir un modèle de segmentation DL automatisé. Dans cette étude, nous avons utilisé ces résultats comme étiquettes de vérité terrain DL et évalué la validité du modèle DL pour générer la même étiquette. En tant que technologie représentative de la segmentation automatisée basée sur l'atlas (voir les détails dans la section supplémentaire A.2), nous avons sélectionné FS (version 7.2), qui est accessible au public pour la recherche en neurosciences et offre des performances de segmentation élevées18,19,20,21,43, 44. De plus, FS ne prend plus en charge CUDA, donc incapable de calculer le temps à l'aide du GPU.

Pour segmenter et extraire les six structures cérébrales à l'aide de FS, il exécute séquentiellement le pipeline recon-all45 et le pipeline Brainstem Substructure46. Nous avons utilisé les deux pipelines car le pipeline recon-all ne prend pas en charge la segmentation des structures du tronc cérébral (par exemple, le pont et le mésencéphale). Cependant, étant donné que le pipeline Brainstem Substructure reçoit des entrées prétraitées du pipeline recon-all, les deux pipelines doivent être exécutés. Par conséquent, l'extraction des six structures cérébrales via FS peut être divisée en prétraitement d'analyse IRM dans le pipeline recon-all et la segmentation restante du pipeline recon-all ainsi que la segmentation dans le pipeline Brainstem Substructure. Ces processus sont expliqués dans la section "Préparation des données" et la section "Segmentation de la structure cérébrale : ligne de base avec FS".

Le prétraitement de l'IRM dans le pipeline recon-all de FS consiste principalement en (1) la correction du mouvement, (2) la normalisation et (3) le décapage du crâne. La correction de mouvement est effectuée avant la moyenne lorsque divers volumes de source sont utilisés, compensant les petites variations de mouvement entre les volumes. FS construit des modèles de surface corticale et la frontière entre la matière blanche et la matière grise corticale pour faire correspondre automatiquement les images cérébrales des patients, à l'aide d'un logiciel17. De plus, la normalisation de l'intensité est appliquée au volume d'origine. Cependant, l'ajustement aux fluctuations d'intensité peut entraver la segmentation basée sur l'intensité. Au lieu de cela, nous mettons à l'échelle les intensités de tous les voxels à la valeur moyenne (110) de la matière blanche.

Après avoir corrigé les mouvements et normalisé les données, FS enlève le crâne et fournit l'IRM cérébrale sans crâne. L'élimination des cavités cérébrales intracrâniennes (par exemple, la peau, la graisse, les muscles, le cou et les globes oculaires) peut réduire la variabilité de l'évaluateur humain47 et favoriser la segmentation automatisée des images cérébrales et améliorer la qualité de l'analyse. Par conséquent, les IRM cérébrales doivent être prétraitées pour isoler le cerveau des tissus extracrâniens ou non cérébraux dans le cadre d'un processus connu sous le nom de "screen stripping"48. Les développeurs de FS ont conçu et appliqué des algorithmes internes automatisés d'extraction du crâne pour isoler les cavités intracrâniennes par défaut.

Dans cette étude, les étapes de pré-traitement de l'IRM cérébrale (c'est-à-dire le décapage du crâne avec correction du mouvement et normalisation d'une IRM cérébrale) ont duré environ 20 minutes. Nous avons converti les images finales dépouillées du crâne en fichiers NIfTI d'une taille de \(256 \fois 256 \fois 128\), tandis que l'IRM cérébrale d'origine avait une taille de \(256\fois 256 \fois 256\), ce qui était ajusté pour une comparaison efficace avec les modèles DL.

Après le pré-traitement (Section "Segmentation de la structure cérébrale : ligne de base avec FS"), FS segmente les six structures cérébrales en appliquant les processus restants du pipeline recon-all et du pipeline complet de la sous-structure du tronc cérébral. Après le décapage du crâne, la segmentation basée sur l'enregistrement se déroule comme suit. FS détermine et affine les interfaces de matière blanche et grise pour les deux hémisphères. Ensuite, FS recherche le bord de la matière grise, qui représente la surface piale. Avec les surfaces piales, FS se dilate et gonfle les berges sulci et les crêtes gyri. Par la suite, il se prolonge à nouveau dans une sphère et morcelle le cortex. Après avoir appliqué ces processus, FS segmente le cerveau. Le pipeline recon-all englobe certaines structures cérébrales (c'est-à-dire le putamen, le caudé, le pallidum et le troisième ventricule), tandis que le pipeline Brainstem Substructure segmente le mésencéphale et le pons.

Dans cette étude, le résultat final de la segmentation a été évalué avec la même taille d'entrée de \(256 \times 256 \times 128\). La taille originale du résultat de la segmentation était \(256 \times 256 \times 256\), mais elle a été ajustée à \(256 \times 256 \times 128\) pour la comparaison avec les modèles DL. De plus, nous avons remplacé FS par un modèle DL appliqué à l'IRM crânienne (c'est-à-dire le résultat de prétraitement du pipeline recon-all) pour effectuer la segmentation. Pour le remplacement, nous avons évalué si l'analyse DL est plus rapide que l'analyse FS et si le résultat de segmentation de DL est suffisamment reproductible par rapport à celui de FS. Les différences entre les segmentations FS et DL sont illustrées à la Fig. 2.

Dans cette étude, nous avons utilisé des modèles DL et FS pour segmenter les mêmes images crâniennes dépouillées (c'est-à-dire des images prétraitées par le pipeline recon-all FS, comme décrit dans la section "Segmentation de la structure cérébrale : ligne de base avec FS"). La taille originale de l'image sans crâne générée par FS était \(256 \times 256 \times 256\), qui a été ajustée à \(256 \times 256 \times 128\) pour la segmentation DL en raison de la mémoire GPU limitée. Nous avons évalué et comparé les performances et le temps d'analyse des modèles DL en remplaçant le processus de segmentation de FS après le décapage du crâne par DL. Le FS peut être inefficace car il segmente l'image entière du cerveau, nécessitant de nombreuses heures de traitement. En fait, FS prend au moins 4,5 h pour segmenter les six structures cérébrales considérées dans cette étude car il nécessite un enregistrement basé sur l'atlas pour transformer les coordonnées de l'ensemble de l'IRM afin de segmenter des structures cérébrales spécifiques. Par conséquent, FS ne peut pas réduire considérablement le temps de traitement même si seulement six structures cérébrales devaient être segmentées. D'autre part, nous avons vérifié que la segmentation DL (par exemple, en utilisant V-Net ou UNETR) prend moins de 1 min à 18 min par cas pour segmenter les six structures cérébrales cibles. Comme les modèles DL ne nécessitent pas d'enregistrement complexe, contrairement aux méthodes d'intelligence non artificielle (par exemple, FS), ils peuvent augmenter considérablement l'efficacité du traitement. Les détails de mise en œuvre des modèles DL sont décrits ici. En tant que modèles DL, nous avons adopté le V-Net29 basé sur CNN et l'UNETR30 basé sur ViT en utilisant les résultats de segmentation fournis par FS comme étiquettes (Section "Segmentation de la structure cérébrale : ligne de base avec FS"). Les deux modèles ont été formés pour reproduire la segmentation FS.

Architecture de segmentation 3D basée sur CNN utilisant V-Net. ResBlock, MaxPooling et UpConvolution ont été utilisés pour réduire la profondeur, la hauteur et la largeur. La sortie indiquée sur la figure est la segmentation du pallidum. (Couche de convolution Conv, normalisation par lots BN).

V-Net a été utilisé pour segmenter un volume entier après avoir formé un CNN de bout en bout sur les volumes IRM pour révéler la prostate29,49,50 L'architecture de V-Net est en forme de V, où la partie gauche du réseau est un chemin de compression, tandis que la partie droite décompresse les entités jusqu'à ce que la taille d'entrée d'origine soit récupérée. La partie gauche du réseau est séparée en étapes qui fonctionnent à des résolutions variables.

Dans cette étude, une à trois couches convolutionnelles ont été utilisées à chaque étape. Une fonction résiduelle a été apprise à chaque niveau. L'entrée de la partie résiduelle a été utilisée dans les couches convolutionnelles et les opérations non linéaires. Cette sortie a été ajoutée à la dernière couche convolutionnelle de la scène. L'unité linéaire rectifiée (ReLU) a été utilisée comme fonction d'activation non linéaire. Des convolutions ont été appliquées tout au long du chemin de compression. La partie droite du réseau a appris une fonction résiduelle similaire à celle de la partie gauche. V-Net a montré des résultats de segmentation prometteurs et l'utilisation de ce modèle dans notre application a amélioré les performances. Le modèle a été ajusté en fonction de la mémoire disponible. L'architecture proposée est illustrée sur la Fig. 3. La partie gauche utilise un bloc résiduel (ResBlock) et une mise en commun maximale (MaxPooling). ResBlock a été appliqué à tous les blocs avec une taille d'entrée de \(256 \times 256 \times 128\). D'autre part, 3D MaxPooling a réduit la profondeur, la hauteur et la largeur des cartes d'entités pour réduire leur résolution. La partie droite utilisait également ResBlock mais a remplacé MaxPooling par UpConvolution, qui consistait en un suréchantillonnage 3D, une normalisation par lots, une activation ReLU et des couches convolutives (filtre \(5 \fois 5\fois 5\), même rembourrage et foulée de 1). Le suréchantillonnage a augmenté la résolution des cartes d'entités et la normalisation par lots a amélioré la convergence sur l'ensemble du réseau51.

Architecture d'UNETR basée sur ViT directement connectée à un décodeur basé sur CNN via des connexions de saut à différentes résolutions pour la segmentation. (Couche de déconvolution Deconv, couche de convolution Conv, normalisation par lots BN, perceptron multicouche MLP).

UNETR30 est une architecture de transformateur pour la segmentation d'images médicales 3D. Il existe une étude qui a utilisé UNETR comme segmentation des tumeurs cérébrales52, mais aucune étude n'a été menée pour la segmentation des parties du cerveau. Il utilise un transformateur comme encodeur pour apprendre les représentations de séquence du volume d'entrée et capturer des informations multi-échelles globales tout en adoptant des architectures en forme de U pour l'encodeur et le décodeur. L'architecture proposée est illustrée à la Fig. 4. L'UNETR a suivi une voie de contraction-expansion avec un codeur comprenant une pile de transformateurs connectés à un décodeur via des connexions de saut. L'encodeur utilisait directement des patchs 3D et était connecté à un décodeur basé sur CNN via une connexion de saut. Un volume d'entrée 3D a été divisé en patchs homogènes non superposés et projeté sur un sous-espace à l'aide d'une couche linéaire. L'intégration de position a été appliquée à la séquence, puis utilisée comme entrée du transformateur. Les représentations codées à différents niveaux dans le transformateur ont été récupérées et envoyées à un décodeur via des connexions de saut pour obtenir les résultats de segmentation.

Pour les modèles DL, l'entrée comprenait un masque cérébral et les structures cérébrales segmentées du patient correspondant dans les IRM, qui ont été fusionnées dans un tableau de dimension \ (256 \ fois 256 \ fois 128 \). La vérité terrain de chaque structure cérébrale a été segmentée à l'aide de FS. Pour l'évaluation, une triple validation croisée des données de test a été appliquée pour calculer le score de dés et la perte de dés. Nous avons implémenté V-Net dans TensorFlow et Keras et l'avons formé pendant 100 époques. Pour UNETR, PyTorch et MONAI53 ont été appliqués, et le modèle a été formé pour 20 000 itérations. Les deux modèles ont utilisé le langage Python et ont été formés à l'aide d'un GPU NVIDIA Tesla V100 DGXS avec une taille de lot de 1 et un taux d'apprentissage initial de 0,0001. Pour le processeur, le processeur Intel(R) Xeon(R) E5-2698 v4 à 2,20 Ghz a été utilisé.

Nous avons évalué la précision des modèles évalués à l'aide du score Dice en comparant la segmentation attendue avec les sorties V-Net (ou UNETR) et FS. Le score Dice mesure le chevauchement entre les masques de segmentation de référence et prédits. Un score Dice de 1 indique une correspondance spatiale parfaite entre les deux images binaires, tandis qu'un score de 0 indique l'absence de corrélation. Nous avons utilisé la perte Dice pour déterminer les performances des trois validations croisées externes sur leurs ensembles de tests pour les structures correspondantes. Si \(F_i\) et \(V_i\) sont le masque de vérité terrain et sa prédiction pour chaque structure cérébrale, respectivement (c'est-à-dire, le masque de segmentation FS \(F_i\) et son masque de prédiction DL \(V_i\), respectivement , comme le montre la Fig. 1), le score de Dice54 pour chaque structure cérébrale \(i \in\) \(\{\)pallidum, putamen, caudé, troisième ventricule, mésencéphale, pons\(\}\) est dérivé comme

où \(\circ {}\) désigne le produit Hadamard (c'est-à-dire la multiplication par composante) et \(||\cdot ||_{1}\) est la norme L1 (c'est-à-dire la somme des valeurs absolues de toutes Composants). De plus, nous avons mesuré le temps de segmentation pour l'évaluation.

Nous avons obtenu les volumes absolus des six structures cérébrales segmentées (c'est-à-dire pons, putamen, pallidum, mésencéphale, caudé et troisième ventricule) prédites par les modèles DL (c'est-à-dire V-Net basé sur CNN ou UNETR basé sur ViT) ou FS . Sur la base du volume absolu des structures cérébrales individuelles, nous avons calculé l'ASC de la classification binaire des maladies, cas normaux contre P-plus, normaux contre PD et PD contre P-plus. L'ASC a été calculée sur la base de la courbe caractéristique de fonctionnement du récepteur produite par la corrélation entre le volume absolu prédit de chaque structure cérébrale et chaque cas.

La classification binaire des maladies a été effectuée en utilisant les six structures cérébrales segmentées individuellement ou collectivement. Pour l'analyse individuelle, l'ASC a été dérivée par une classification binaire basée sur le seuillage en obtenant le volume absolu des structures individuelles. Pour une analyse complète de toutes les structures, nous avons en outre envisagé un algorithme de classification ML pour effectuer une classification binaire des maladies avec les six volumes comme entrées. Pour l'algorithme de classification, la régression logistique binomiale (LR) et le renforcement du gradient extrême (XGBoost) ont été utilisés. LR est un modèle statistique largement utilisé dans la classification ML55,56,57. XGBoost est une méthode bien établie qui produit des résultats avancés parmi les techniques basées sur le renforcement du gradient58 (par exemple, XGBoost a remporté avec succès 17 des 29 tâches ML publiées sur Kaggle en 201559). Dans les deux méthodes, nous avons évalué l'ASC obtenue par le modèle DL et FS par triple validation croisée.

Les auteurs déclarent que les principales données soutenant les résultats de cette étude sont disponibles dans le document. Les ensembles de données brutes du Samsung Medical Center sont protégés pour préserver la confidentialité des patients, mais peuvent être mis à disposition sur demande raisonnable à condition que l'approbation soit obtenue du comité d'examen institutionnel correspondant. Pour la demande de disponibilité des données, veuillez contacter Jong Hyeon Ahn à l'adresse [email protected].

Le code utilisé pour les modèles DL est disponible sur GitHub : https://github.com/kskim-phd/AI_vs_FS.

Une correction à cet article a été publiée : https://doi.org/10.1038/s41598-023-33774-z

Berg, D. et al. Critères de recherche MDS pour la maladie de Parkinson prodromique. Movem. Désordre. 30, 1600-1611. https://doi.org/10.1002/mds.26431 (2015).

Article Google Scholar

Meijer, FJA, Goraj, B., Bloem, BR & Esselink, RAJ Application clinique de l'IRM cérébrale dans le bilan diagnostique du parkinsonisme. J. Park. Dis. 7, 211–217. https://doi.org/10.3233/JPD-150733 (2017).

Article Google Scholar

Watanabe, H. et al. Caractéristiques cliniques et d'imagerie de l'atrophie multisystématisée : défis pour un diagnostic précoce et cliniquement définitif. J. Movem. Désordre. 11, 107. https://doi.org/10.14802/jmd.1802 (2018).

Article Google Scholar

Whitwell, JL et al. Biomarqueurs radiologiques pour le diagnostic dans la PSP : où en sommes-nous et où devons-nous être ?. Movem. Désordre. 32, 955–971. https://doi.org/10.1002/mds.27038 (2017).

Article Google Scholar

Jankovic, J., Hallett, M., Okun, MS, Comella, CL & Fahn, S. Livre électronique sur les principes et la pratique des troubles du mouvement (Elsevier Health Sciences, Amsterdam, 2021).

Google Scholar

Hussl, A. et al. Précision diagnostique de l'indice de résonance magnétique parkinsonien et du rapport aire mésencéphale-pontine pour différencier la paralysie supranucléaire progressive de la maladie de Parkinson et de la variante parkinsonienne de l'atrophie multisystématisée. Movem. Désordre. 25, 2444–2449. https://doi.org/10.1002/mds.23351 (2010).

Article Google Scholar

Quattrone, A. et al. Indice d'imagerie par résonance magnétique pour la différenciation de la paralysie supranucléaire progressive de la maladie de Parkinson et de la variante parkinsonienne de l'atrophie multisystématisée. Radiologie 246, 214–221. https://doi.org/10.1148/radiol.2453061703 (2008).

Article PubMed Google Scholar

Paviour, DC, Price, SL, Jahanshahi, M., Lees, AJ & Fox, NC Les volumes cérébraux régionaux distinguent PSP, MSA-P et PD : corrélations clinico-radiologiques basées sur l'IRM. Movem. Désordre. 21, 989–996. https://doi.org/10.1002/mds.20877 (2006).

Article Google Scholar

Zanigni, S. et al. Précision des marqueurs MR pour différencier la paralysie supranucléaire progressive de la maladie de Parkinson. NeuroImage Clin. 11, 736–742. https://doi.org/10.1016/j.nicl.2016.05.016 (2016).

Article PubMed PubMed Central Google Scholar

Massey, LA et al. Imagerie par résonance magnétique conventionnelle dans la paralysie supranucléaire progressive confirmée et l'atrophie multisystématisée. Movem. Désordre. 27, 1754-1762. https://doi.org/10.1002/mds.24968 (2012).

Article Google Scholar

Schrag, A. et al. Différenciation des syndromes parkinsoniens atypiques avec l'IRM de routine. Neurologie 54, 697–697. https://doi.org/10.1212/WNL.54.3.697 (2000).

Article CAS PubMed Google Scholar

Kim, YE, Kang, SY, Ma, H.-I., Ju, Y.-S. & Kim, YJ Une échelle d'évaluation visuelle pour le signe du colibri avec une validité diagnostique ajustable. J. Park. Dis. 5, 605–612. https://doi.org/10.3233/JPD-150537 (2015).

Article Google Scholar

Saeed, U., Lang, AE et Masellis, M. La neuroimagerie progresse dans la maladie de Parkinson et les syndromes parkinsoniens atypiques. Devant. Neurol. 1189, 572976. https://doi.org/10.3389/fneur.2020.572976 (2020).

Article Google Scholar

Moller, L. et al. Morphométrie IRM manuelle dans les syndromes parkinsoniens. Movem. Désordre. 32, 778–782. https://doi.org/10.1002/mds.26921 (2017).

Article Google Scholar

Despotović, I., Goossens, B. & Philips, W. Segmentation IRM du cerveau humain : défis, méthodes et applications. Calcul. Mathématiques. Méthodes Méd. https://doi.org/10.1155/2015/450341 (2015).

Article PubMed PubMed Central Google Scholar

Fawzi, A., Achuthan, A. & Belaton, B. Segmentation de l'image cérébrale au cours des dernières années : une revue narrative. Brain Sci.https://doi.org/10.3390/brainsci11081055 (2021).

Article PubMed PubMed Central Google Scholar

Fischl, B. Freesurfeur. NeuroImage 62, 774–781. https://doi.org/10.1016/j.neuroimage.2012.01.021 (2012).

Article PubMed Google Scholar

Dewey, J. et al. Fiabilité et validité du logiciel de volumétrie automatisé basé sur l'IRM par rapport à la mesure manuelle auto-assistée des structures sous-corticales chez les patients infectés par le VIH à partir d'une étude multisite. NeuroImage 51, 1334–1344. https://doi.org/10.1016/j.neuroimage.2010.03.033 (2010).

Article PubMed Google Scholar

Eggert, LD, Sommer, J., Jansen, A., Kircher, T. & Konrad, C. Précision et fiabilité des voies automatisées de segmentation de la matière grise sur des images de résonance magnétique structurelle réelles et simulées du cerveau humain. PLOS ONEhttps://doi.org/10.1371/journal.pone.0045081 (2012).

Article PubMed PubMed Central Google Scholar

Mayer, KN et al. Comparaison des méthodes de volumétrie cérébrale automatisée avec la stéréologie chez les enfants de 2 à 3 ans. Neuroradiologie 58, 901–910. https://doi.org/10.1007/s00234-016-1714-x (2016).

Article PubMed Google Scholar

Klauschen, F., Goldman, A., Barra, V., Meyer-Lindenberg, A. & Lundervold, A. Évaluation des méthodes automatisées de segmentation et de volumétrie des images IRM du cerveau. Hum. Cartographie du cerveau. 30, 1310–1327. https://doi.org/10.1002/hbm.20599 (2009).

Article PubMed Google Scholar

Pham, DL, Xu, C. & Prince, JL Méthodes actuelles de segmentation d'images médicales. Annu. Rév. Biomed. Ing. 2, 315–337. https://doi.org/10.1146/annurev.bioeng.2.1.315 (2000).

Article CAS PubMed Google Scholar

Christensen, GE, Joshi, SC et Miller, MI Transformation volumétrique de l'anatomie du cerveau. IEEE Trans. Méd. Imagerie 16, 864–877. https://doi.org/10.1109/42.650882 (1997).

Article CAS PubMed Google Scholar

Collins, DL, Holmes, CJ, Peters, TM & Evans, AC Segmentation neuroanatomique automatique basée sur un modèle 3D. Hum. Cartographie du cerveau. 3, 190-208. https://doi.org/10.1002/hbm.460030304 (1995).

Article Google Scholar

Iosifescu, DV et al. Un algorithme d'enregistrement automatisé pour mesurer les structures cérébrales sous-corticales par IRM. NeuroImage 6, 13–25. https://doi.org/10.1006/nimg.1997.0274 (1997).

Article CAS PubMed Google Scholar

McClure, P. et al. Savoir ce que vous savez dans la segmentation du cerveau en utilisant les réseaux de neurones profonds bayésiens. Devant. Neuroinform.https://doi.org/10.3389/fnif.2019.00067 (2019).

Article PubMed PubMed Central Google Scholar

Rastogi, D., Johri, P. & Tiwari, V. Segmentation des tumeurs cérébrales et prédiction des tumeurs à l'aide de l'architecture d'apprentissage en profondeur 2D-Vnet. En 2021, 10e Conférence internationale sur la modélisation des systèmes et l'avancement des tendances de la recherche (SMART)https://doi.org/10.1109/smart52563.2021.9676317 (2021).

Hatamizadeh, A. et al. Swin UNETR : Transformateurs Swin pour la segmentation sémantique des tumeurs cérébrales dans les images IRM. Dans l'atelier international MICCAI sur les lésions cérébrales, 272-284 (Springer, 2022).

Milletari, F., Navab, N. & Ahmadi, S.-A. V-Net : Réseaux de neurones entièrement convolutifs pour la segmentation volumétrique d'images médicales. En 2016, quatrième conférence internationale sur la vision 3D (3DV), 565–571, ​​https://doi.org/10.1109/3DV.2016.79 (2016).

Hatamizadeh, A. et al. Unetr : Transformateurs pour la segmentation d'images médicales 3D. Dans Actes de la conférence IEEE/CVF sur la vision par ordinateur et la reconnaissance de formes, 574–584 (2022).

Chougar, L. et al. Catégorisation automatisée des syndromes parkinsoniens à l'aide de l'imagerie par résonance magnétique en milieu clinique. Movem. Désordre. 36, 460–470. https://doi.org/10.1002/mds.28348 (2021).

Article CAS Google Scholar

Sjöström, H., Granberg, T., Hashim, F., Westman, E. & Svenningsson, P. La volumétrie automatisée du tronc cérébral peut aider au diagnostic des troubles parkinsoniens. Parc. Rel. Désordre. 79, 18-25 (2020).

Article Google Scholar

Brooks, DJ & Seppi, K. Critères de neuroimagerie proposés pour le diagnostic de l'atrophie multisystématisée. Movem. Désordre. 24, 949–964. https://doi.org/10.1002/mds.22413 (2009).

Article Google Scholar

Hotter, A., Esterhammer, R., Schocke, MF et Seppi, K. Potentiel des techniques avancées d'imagerie par résonance magnétique dans le diagnostic différentiel du parkinsonisme. Movem. Désordre. 24, S711–S720. https://doi.org/10.1002/mds.22648 (2009).

Article Google Scholar

Oba, H. et al. Diagnostic IRM nouveau et fiable pour la paralysie supranucléaire progressive. Neurologie 64, 2050–2055. https://doi.org/10.1212/01.WNL.0000165960.04422.D0 (2005).

Article CAS PubMed Google Scholar

Quattrone, A. et al. Une nouvelle mesure IRM pour différencier précocement la paralysie supranucléaire progressive de la maladie de Parkinson de novo dans la pratique clinique : une étude internationale. Movem. Désordre. 36, 681–689. https://doi.org/10.1002/mds.28364 (2021).

Article CAS Google Scholar

Quattrone, A. et al. Un nouvel indice d'imagerie par résonance magnétique pour différencier la paralysie-parkinsonisme supranucléaire progressive de la maladie de Parkinson. Parc. Rel. Désordre. 54, 3–8. https://doi.org/10.1016/j.parkreldis.2018.07.016 (2018).

Article Google Scholar

Rizzo, G. et al. Exactitude du diagnostic clinique de la maladie de Parkinson : revue systématique et méta-analyse. Neurologie 86, 566–576. https://doi.org/10.1212/WNL.0000000000002350 (2016).

Article PubMed Google Scholar

Hughes, AJ, Daniel, SE, Kilford, L. & Lees, AJ Exactitude du diagnostic clinique de la maladie de Parkinson idiopathique : Une étude clinico-pathologique de 100 cas. J. Neurol. Neurochirurgie. Psychiatrie 55, 181–184. https://doi.org/10.1136/jnnp.55.3.181 (1992) https://jnnp.bmj.com/content/55/3/181.full.pdf.

Article CAS PubMed PubMed Central Google Scholar

Gilman, S. et al. Deuxième déclaration de consensus sur le diagnostic de l'atrophie multisystématisée. Neurologie 71, 670–676. https://doi.org/10.1212/01.wnl.0000324625.00404.15 (2008) https://n.neurology.org/content/71/9/670.full.pdf.

Article CAS PubMed PubMed Central Google Scholar

Höglinger, GU et al. Diagnostic clinique de la paralysie supranucléaire progressive : les critères de la société des troubles du mouvement. Movem. Désordre. 32, 853–864. https://doi.org/10.1002/mds.26987 (2017).

Article Google Scholar

Whitcher, B., Schmid, VJ & Thorton, A. Travailler avec les normes de données DICOM et NIfTI dans RJ Stat. Logiciel 44, 1–29. https://doi.org/10.18637/jss.v044.i06 (2011).

Article Google Scholar

Heinen, R. et al. Robustesse des méthodes automatisées pour les mesures du volume cérébral à travers différentes forces de champ IRM. PLoS ONEhttps://doi.org/10.1371/journal.pone.0165719 (2016).

Article PubMed PubMed Central Google Scholar

Velasco-Annis, C., Akhondi-Asl, A., Stamm, A. & Warfield, SK Reproductibilité des algorithmes de segmentation de l'IRM cérébrale : comparaison empirique de la carte locale PSTAPLE, FreeSurfer et FSL-first. J. Neuroimaging 28, 162–172. https://doi.org/10.1111/jon.12483 (2017).

Article PubMed Google Scholar

recon-tout.

Iglesias, JE et al. Segmentation bayésienne des structures du tronc cérébral en IRM. NeuroImage 113, 184–195. https://doi.org/10.1016/j.neuroimage.2015.02.065 (2015).

Article PubMed Google Scholar

Kleesiek, J. et al. Extraction cérébrale profonde par IRM : un réseau de neurones convolutifs 3D pour le décapage du crâne. NeuroImage 129, 460–469. https://doi.org/10.1016/j.neuroimage.2016.01.024 (2016).

Article PubMed Google Scholar

Kalavathi, P. & Prasath, Méthodes VBS sur le décapage du crâne des images de scanner de tête IRM : Une revue. J. Creusez. Imagerie 29, 365–379. https://doi.org/10.1007/s10278-015-9847-8 (2015).

Article Google Scholar

Bocchetta, M. et al. La segmentation automatisée du tronc cérébral détecte une implication différentielle dans les syndromes parkinsoniens atypiques. J. Movem. Désordre. 13, 39–46. https://doi.org/10.14802/jmd.19030 (2020).

Article Google Scholar

Manjon, JV et al. pBrain : un nouveau pipeline pour la segmentation de la structure cérébrale liée à la maladie de Parkinson. NeuroImage Clin. 25, 102184. https://doi.org/10.1016/j.nicl.2020.102184 (2020).

Article PubMed PubMed Central Google Scholar

Ioffe, S. & Szegedy, C. Normalisation par lots : Accélérer la formation de réseau en profondeur en réduisant le décalage de covariable interne. https://doi.org/10.48550/ARXIV.1502.03167 (2015).

Hatamizadeh, A. et al. Swin unetr : transformateurs Swin pour la segmentation sémantique des tumeurs cérébrales dans les images irm. Dans BrainLes@MICCAI (2022).

Consortium, M. Monai : Réseau ouvert médical pour ai. Technologie. Rep.https://doi.org/10.5281/zenodo.6903385 (2022).

Sheller, MJ et al. Apprentissage fédéré en médecine : faciliter les collaborations multi-institutionnelles sans partager les données des patients. Sci. Rep.https://doi.org/10.1038/s41598-020-69250-1 (2020).

Article PubMed PubMed Central Google Scholar

Austin, PC, Tu, JV, Ho, JE, Levy, D. & Lee, DS Utilisation de méthodes issues de la littérature sur l'exploration de données et l'apprentissage automatique pour la classification et la prédiction des maladies : une étude de cas examinant la classification des sous-types d'insuffisance cardiaque. J.Clin. Épidémiol. 66, 398–407. https://doi.org/10.1016/j.jclinepi.2012.11.008 (2013).

Article PubMed PubMed Central Google Scholar

Thabtah, F., Abdelhamid, N. & Peebles, D. Une classification de l'autisme par apprentissage automatique basée sur une analyse de régression logistique. Inf. Santé Sci. Syst.https://doi.org/10.1007/s13755-019-0073-5 (2019).

Article PubMed PubMed Central Google Scholar

Nusinovici, S. et al. La régression logistique était aussi efficace que l'apprentissage automatique pour prédire les principales maladies chroniques. J.Clin. Épidémiol. 122, 56–69. https://doi.org/10.1016/j.jclinepi.2020.03.002 (2020).

Article PubMed Google Scholar

Friedman, JH Approximation de la fonction gourmande : une machine de renforcement de gradient. Anne. Statistique. 29, 1189–1232. https://doi.org/10.1214/aos/1013203451 (2001).

Article MathSciNet MATH Google Scholar

Ogunleye, A. & Wang, Q.-G. Modèle XGBoost pour le diagnostic des maladies rénales chroniques. IEEE/ACM Trans. Calcul. Biol. Bioinformer. 17, 2131–2140. https://doi.org/10.1109/TCBB.2019.2911071 (2020).

Article PubMed Google Scholar

Télécharger les références

Cette étude a été soutenue par la subvention de la National Research Foundation of Korea (NRF) financée par le gouvernement coréen (MSIT) (2021R1F1A106153511), par la subvention du Korea Medical Device Development Fund financée par le gouvernement coréen (ministère des Sciences et des TIC, ministère du Commerce , Industrie et Énergie, Ministère de la Santé et du Bien-être, Ministère de la Sécurité alimentaire et pharmaceutique) (202011B08-02, KMDF_PR_20200901_0014-2021-02), par le Programme d'innovation technologique (20014111) financé par le Ministère du Commerce, de l'Industrie et de l'Énergie (MOTIE , Corée), et par le projet Future Medicine 20*30 du Samsung Medical Center (SMX1210791). Les bailleurs de fonds ont fourni un soutien sous forme de salaires à certains auteurs, mais n'ont pas participé à la conception de l'étude, à la collecte et à l'analyse des données, à la décision de publier ou à la préparation du manuscrit. Les rôles spécifiques des auteurs sont rapportés dans la section correspondante.

Ces auteurs ont contribué à parts égales : Joomee Song et Juyoung Hahm.

Department of Neurology and Neuroscience Center, Samsung Medical Center, Sungkyunkwan University School of Medicine, Séoul, République de Corée

Le meilleur de Joomee Song, Jinyoung Youn, Jin Whan Cho et Jong Hyeon Ahn

Medical AI Research Center, Research Institute for Future Medicine, Samsung Medical Center, Séoul, République de Corée

Juyoung Hahm, Jisoo Lee, Chae Yeon Lim, Myung Jin Chung et Kyungsu Kim

Département de biostatistique, Université de Columbia

Juyoung Hahm

Département de génie électrique et informatique, Université du Maryland, College Park, MD, États-Unis

Jisoo Lee

Département de gestion et de recherche sur les dispositifs médicaux, SAIHST, Université Sungkyunkwan, Séoul, République de Corée

Chae Yeon Lim

Département de radiologie, Centre médical Samsung, École de médecine de l'Université Sungkyunkwan, Séoul, République de Corée

Myung Jin Chung

Département de convergence des données et médecine future, École de médecine de l'Université Sungkyunkwan, Séoul, République de Corée

Myung Jin Chung et Kyungsu Kim

Département de radiologie, Massachusetts General Brigham and Harvard Medical School, Boston, MA, États-Unis

Kyungsu Kim

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

(1) Projet de recherche : A. Conception et conception, B. Acquisition de données, C. Analyse et interprétation de données. (2) Manuscrit : A. Rédaction de la première ébauche, B. Révision et critique. (3) Autres : A. Analyse statistique, B. Obtention de financement, C. Appui technique, D. Supervision de l'étude, E. Supervision de la collecte des données. JS : 1A, 1B, 1C, 2A, 2B, JH : 1C, 2A, 2B, 3A, 3C, JL : 2B, 3A, 3C, CYL : 3C, MJC : 3B, 3C, JY : 1B, 2B, JWC : 1B, 2C, 3E, JHA : : 1B, 1C, 2B, 3D, 3E, KK : 1A, 1C, 2A, 2B, 3A, 3C, 3D.

Correspondance avec Jong Hyeon Ahn ou Kyungsu Kim.

Les auteurs ne déclarent aucun intérêt concurrent.

Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

La version originale en ligne de cet article a été révisée : dans la version originale de cet article, le fichier supplémentaire, qui était inclus dans la soumission initiale, a été omis de la section Informations supplémentaires. Le bon fichier d'informations supplémentaires accompagne désormais l'article d'origine.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournir un lien vers la licence Creative Commons et indiquer si des modifications ont été apportées. Les images ou tout autre matériel de tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Song, J., Hahm, J., Lee, J. et al. Validation comparative des méthodes IA et non IA en volumétrie IRM pour diagnostiquer les syndromes parkinsoniens. Sci Rep 13, 3439 (2023). https://doi.org/10.1038/s41598-023-30381-w

Télécharger la citation

Reçu : 15 octobre 2022

Accepté : 21 février 2023

Publié: 01 mars 2023

DOI : https://doi.org/10.1038/s41598-023-30381-w

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.

PARTAGER