banner

Nouvelles

Aug 31, 2023

Applications de l'apprentissage automatique dans la classification des pignons de pin

Rapports scientifiques volume 12, Numéro d'article : 8799 (2022) Citer cet article

1128 accès

2 Citations

2 Altmétrique

Détails des métriques

Les pignons de pin ne sont pas seulement l'agent important de la reproduction et du reboisement du pin, mais aussi la noix couramment consommée avec des valeurs nutritives élevées. Cependant, il est difficile de distinguer les pignons de pin en raison de la similitude morphologique entre les espèces. Par conséquent, il est important d'améliorer la qualité des pignons de pin et de résoudre le problème d'adultération rapidement et de manière non destructive. Dans cette étude, sept pignons de pin (Pinus bungeana, Pinus yunnanensis, Pinus thunbergii, Pinus armandii, Pinus massoniana, Pinus elliottii et Pinus taiwanensis) ont été utilisés comme espèces d'étude. 210 spectres dans le proche infrarouge (NIR) ont été collectés à partir des sept espèces de pignons de pin, cinq méthodes d'apprentissage automatique (Decision Tree (DT), Random Forest (RF), Multilayer Perceptron (MLP), Support Vector Machine (SVM) et Naive Bayes (NB)) ont été utilisés pour identifier les espèces de pignons de pin. 303 images ont été utilisées pour collecter des données morphologiques afin de construire un modèle de classification basé sur cinq modèles de réseaux de neurones convolutionnels (CNN) (VGG16, VGG19, Xception, InceptionV3 et ResNet50). Les résultats expérimentaux de la spectroscopie NIR montrent que le meilleur modèle de classification est le MLP et la précision est proche de 0,99. Un autre résultat expérimental d'images montre que le meilleur modèle de classification est InceptionV3 et la précision est proche de 0,964. Quatre gammes importantes de bandes d'ondes, 951–957 nm, 1 147–1 154 nm, 1 907–1 927 nm, 2 227–2 254 nm, se sont avérées fortement liées à la classification des pignons de pin. Cette étude montre que l'apprentissage automatique est efficace pour la classification des pignons de pin, fournissant des solutions et des méthodes scientifiques pour une classification rapide, non destructive et précise des différentes espèces de pignons de pin.

Il existe plus de 113 espèces formellement reconnues de Pinus Linn principalement réparties dans l'hémisphère nord1, 2, elles forment une partie importante des écosystèmes forestiers. Les pignons de pin sont les graines des pins, c'est une noix couramment consommée et un important agent de reboisement et de reproduction3. Les pignons de pin sont riches en protéines, acides gras, minéraux et vitamines. Ils contiennent également de l'acide oléique, de l'acide linolénique et d'autres acides gras insaturés, qui facilitent la prévention des maladies cardiovasculaires4. La reconnaissance des espèces de pignons de pin est importante pour la sécurité alimentaire et la qualité des pignons de pin. Ces dernières années, la hausse du prix des pignons de pin a apporté d'énormes avantages économiques. La production mondiale de pignons de pin en 2020-2021 est d'environ 381 700 tonnes. La Chine est le principal pays importateur et exportateur de pignons de pin dans le monde. Compte tenu de la similitude visuelle entre les pignons de pin, la possibilité de falsification des produits est très élevée et le problème de falsification a un impact important sur la santé et l'économie. Par conséquent, comment détecter les produits frelatés dans les pignons de pin de manière pratique, rapide et non destructive est un défi pour la sécurité alimentaire des pignons de pin.

Actuellement, les méthodes courantes d'identification des espèces comprennent l'analyse morphologique5, la technologie des marqueurs moléculaires6,7,8,9, l'électrophorèse des protéines10, la chromatographie liquide11, l'analyse spectrale12,13,14 et la reconnaissance d'images15. L'analyse morphologique nécessite un haut niveau d'expertise qui n'est pas facilement acquis et en tant que tel, en raison de la grande similitude morphologique entre certaines espèces, le taux d'identification précise est faible16. Bien que l'utilisation de marqueurs moléculaires donne un taux de reconnaissance plus élevé et plus de précision, il s'agit d'une méthodologie destructrice, chronophage et limitée par le nombre de marqueurs publiés dans les bases de données publiques. Par conséquent, cette étude établit des modèles d'apprentissage automatique pour la classification des pignons de pin basés sur la spectroscopie et les images dans le proche infrarouge (NIR).

La spectroscopie NIR est une méthodologie qui utilise les vibrations moléculaires dans le spectre infrarouge dans le matériau. Le processus de spectroscopie NIR implique que l'appareil NIR émette une lumière infrarouge qui pénètre dans l'échantillon. Ici, il est réfléchi, réfracté, diffusé et absorbé et ramène finalement les informations de l'échantillon dans le détecteur. Cette méthodologie est pratique, rapide, non destructive et rentable. Il a été utilisé dans de nombreux domaines agricoles, y compris la recherche sur la production de blé17, de soja18, de niébé19 et de riz12. Jusqu'à présent, il existe peu de rapports sur l'application de la spectroscopie NIR dans la recherche forestière et sur les pignons de pin. Plus précisément, Tigabu et al.20 ont collecté des données spectrales dans le visible-NIR de noix de Pinus sylvestris dans différentes zones et ont prétraité les données spectrales au moyen de la correction de dispersion multiplicative (MSC). La source de noix a été construite à l'aide de la modélisation indépendante souple de l'analogie de classe (SIMCA) et de l'analyse discriminante des moindres carrés partiels (PLS-DA). Loewe et al.21 ont collecté des données spectrales NIR de Pinus pinea méditerranéen dans des plantations chiliennes à des fins de classification. Moscetti et al.22 ont collecté les données spectrales NIR des noix de P. pinea et Pinus sibirica dans différentes régions et ont établi un modèle de classification spectrale en utilisant les méthodes PLS-DA et Interval PLS-DA (IPLS-DA). Cependant, les effets d'autres modèles de classification différents doivent encore être discutés plus avant dans plus d'espèces de pignons de pin.

L'apprentissage automatique basé sur l'image a été appliqué avec succès à l'identification des ravageurs du riz23, à la détection des dommages causés par Dendrolimus punctatus Walker24 et à d'autres domaines agricoles et forestiers. L'apprentissage en profondeur, un type d'apprentissage automatique, utilise l'analyse hiérarchique et le calcul à plusieurs niveaux pour obtenir des résultats. Le réseau de neurones à convolution profonde (CNN) a été appliqué avec succès dans la reconnaissance d'images pour des applications telles que la reconnaissance de pesto de tomate25, la reconnaissance d'images de poisson26. Moscetti et al.22 ont collecté les données d'image des noix de P. pinea et P. sibirica dans différentes régions, ont procédé à l'extraction des caractéristiques, ont obtenu 10 caractéristiques basées sur les données d'image et ont utilisé ces caractéristiques pour construire un modèle de classification basé sur l'image. Bien que la faisabilité de la classification des pignons de pin ait été prouvée sur la base de caractéristiques d'image extraites manuellement, le modèle de classification automatique mérite toujours des recherches plus approfondies sur davantage d'espèces de pignons de pin.

Par conséquent, l'utilisation de la technologie informatique moderne pour classer les pignons de pin favorise grandement la recherche d'une classification non destructive, rapide et précise des pignons de pin. Dans cette étude, la technologie d'apprentissage automatique est adoptée et le potentiel d'application de l'apprentissage automatique dans la classification des pignons de pin est vérifié. Les contributions des travaux en cours sont : (1) Des marqueurs moléculaires ont été utilisés pour identifier les espèces de pignons de pin ; (2) Spectroscopie NIR et images de 7 pignons de pin (deux types de pignons comestibles (Pinus bungeana et Pinus armandii) et cinq espèces communes (Pinus yunnanensis, Pinus thunbergii, Pinus massoniana, Pinus elliottii et Pinus taiwanensis)) ont été collectées. (3) La spectroscopie NIR utilise cinq méthodes d'apprentissage automatique pour la classification, tandis que la reconnaissance d'image choisit cinq modèles CNN. Cette étude vérifie le potentiel de l'apprentissage automatique dans la classification des pignons de pin et fournit une méthode pratique pour une identification plus rapide, non destructive et précise des espèces de pignons de pin.

Les séquences ITS2 et rbcL assemblées ont été utilisées comme marqueurs moléculaires par comparaison avec la base de données GenBank (https://www.ncbi.nlm.nih.gov/search/all/?term=blast). Le tableau 1 montre que la longueur de la séquence ITS2 varie de 477 à 482 pb tandis que la longueur du gène rbcL varie de 677 à 720 pb (tableau 2). Les numéros d'accès GenBank sont OK274058-OK274066 et OK271114-OK271122. Les résultats montrent que P. massoniana, P. armandii, P. thunbergii et P. bungeana ont été reconnus tandis que P. taiwanensis (synonyme est Pinus hwangshanensis) n'a pas été reconnu. Il n'y avait pas les mêmes espèces dans GenBank par rapport aux séquences de gènes ITS2 de P. yunnanensis et P. elliottii. Il est évident que ITS2 et rbcL sont les marqueurs moléculaires appropriés pour la reconnaissance des espèces de certains pignons et les analyses moléculaires sont limitées par les données publiquement disponibles dans GenBank. Puis en consultant l'Institut de botanique de Kunming, Académie chinoise des sciences, les étiquettes ont été réalisées à nouveau pour confirmer la fiabilité et l'authenticité des espèces de pignons de pin.

Les spectres NIR des pignons de pin collectés ont été analysés et sont représentés sur la Fig. 1. Il ressort de tous les spectres NIR originaux (Fig. 1a) que l'amplitude, les pics et les creux des spectres NIR des sept pignons ont des changements similaires. Parmi eux, la valeur de P. armandii est à une position plus élevée (indiquant la valeur d'absorbance la plus élevée) par rapport à l'ensemble de la gamme, et la valeur de P. massoniana est à une position plus basse. Les spectres NIR normalisés (Fig. 1b) montrent que le spectre NIR de chaque pignon est plus distinct après la normalisation, et les changements entre les valeurs des pignons peuvent être observés plus clairement. Parmi eux, P. armandii et P. bungeana sont fortement mélangés dans la gamme de 9 000 à 4 000 cm-1 (1 111 à 2 500 nm).

Données spectrales NIR de noix de pin. (a) Tous les spectres NIR originaux ; (b) Les spectres NIR normalisés, R représente la réflectivité et log(1/R) représente l'absorbance. Les bandes droites verticales représentent les bandes sensibles à 10 506,29–10 452,29 cm−1, 8712,813–8658,815 cm−1, 5241,572–5187,575 cm−1 et 4489,471–4435,474 cm−1 (951–957 nm, 1 147–1 154 nm, 1 907–1 927 nm , 2 227–2 254 nm) sélectionnés en déplaçant les fenêtres coulissantes.

Dix analyses indépendantes ont été effectuées sur des données spectrales NIR normalisées et non normalisées à l'aide des cinq modèles d'apprentissage automatique traditionnels, à savoir l'arbre de décision (DT), la forêt aléatoire (RF), le perceptron multicouche (MLP), la machine à vecteurs de support (SVM) et Naive Bayes (N.-B.) (tableau 3). Il ressort du tableau 3 que la classification des pignons de pin est efficace en utilisant ces modèles. Lorsque les données ne sont pas normalisées, la précision des modèles de classification DT et RF est supérieure à 0,83. Pour les données normalisées, la précision de la classification des cinq modèles est > 0,80, MLP et SVM fournissant une précision > 0,93. Avec le pré-traitement des données, les performances des modèles MLP et SVM ont été grandement améliorées, la précision du modèle MLP atteint 0,99, tandis que le modèle SVM atteint 0,94. Dans l'ensemble, ces résultats montrent que le modèle RF est une meilleure méthode de classification lorsque les données ne sont pas normalisées, tandis que le modèle MLP est le meilleur pour les données normalisées.

La précision (Pre) et le score F1 (F1) sont présentés dans le Tableau 4 (données non normalisées) et le Tableau 5 (données normalisées). Dans le tableau 4, la précision et le score F1 de P. armandii et P. bungeana sont plus élevés, et la précision de P. bungeana est la plus élevée, atteignant 0,97. Cependant, la précision et le score F1 de P. taiwanensis et P. massoniana sont assez faibles, atteignant des scores de précision de 18 % et 22 % respectivement. Sur la Fig. 1a, la distinction entre P. armandii et P. bungeana est claire, tandis que P. taiwanensis et P. massoniana sont moins distincts et donc plus difficiles à classer. Cependant, le tableau 5 montre que la précision et les scores F1 des sept espèces de pignons sont grandement améliorés après normalisation. Cela indique que la normalisation des données est une étape nécessaire pour le traitement des données spectrales.

Trois méthodes de prétraitement ont été exécutées pour les ensembles de données image_clip (images coupées), image_trans (images transformées) et image_gray (images transformées en niveaux de gris). Les données image_clip sont utilisées pour explorer les résultats du modèle d'apprentissage profond sur les données d'origine, image_trans et image_gray sont obtenues en étendant la transformation image_clip. Les modèles VGG16, VGG19, Xception, ResNet50 et InceptionV3 ont été sélectionnés avec les options de 100 époques, et la précision et la perte ont été utilisées comme indicateurs d'évaluation. Les figures 2, 3 et 4 présentent les valeurs de précision et de perte des cinq modèles entraînés et vérifiés. D'après ces chiffres, Xception et InceptionV3 ont les meilleures performances avec la plus grande précision et la plus faible perte par rapport aux modèles VGG16, VGG19 et ResNet50. De plus, parmi les trois méthodes de prétraitement, image_trans surpasse image_gray et image_clip. Par conséquent, les modèles Xception et InceptionV3 sont les mieux adaptés à la classification basée sur l'image des pignons de pin et les images doivent être transformées mais pas définies en niveaux de gris (tableau 6).

Précision et perte pour cinq modèles différents utilisant des données image_clip.

Précision et perte pour cinq modèles différents utilisant des données image_trans.

Précision et perte pour cinq modèles différents utilisant des données image_gray.

Des études antérieures ont montré que le genre Pinus est originaire du début du Crétacé (116–83 Mya) et a divergé en deux sous-genres Pinus (P. massoniana, P. thunbergii, P. yunnanensis, P. taiwanensis et P. massoniana, etc.) et Strobus (P. armandii et P. bungeana, etc.)2, 27. Au cours de la longue histoire évolutive, il peut avoir connu de nombreux événements tels que le mouvement des plaques, la transition mer-terre et les changements climatiques2, 28, 29. La composition chimique de la plante organes est le résultat de l'interaction entre les plantes et l'environnement dans le long processus d'évolution30,31,32. Nos résultats suggèrent que les espèces P. armandii et P. bungeana du sous-genre Strobus ont des bandes plus élevées dans les régions 9 000–4 000 cm−1 (1 111–2 500 nm) que les cinq autres espèces du sous-genre Pinus (Fig. 1). Ces bandes se sont révélées être associées à des protéines, des acides aminés, de l'humidité, des lipides et des glucides dans des études précédentes20, 22. Notamment, nos résultats ont également montré que trois bandes sensibles (1 147–1 154 nm, 1 907–1 927 nm, 2 227–2 254 nm) dans ces régions (1 111 à 2 500 nm) ont une grande influence sur la précision du modèle basé sur la méthode de la fenêtre glissante (Fig. 1). Différent du sous-genre Pinus, les espèces P. armandii et P. bungeana du sous-genre Strobus étaient principalement distribuées dans le nord de la Chine (tableau S1). La différence de certaines substances pourrait être causée par certaines répartitions géographiques et conditions environnementales telles que l'altitude, la température annuelle moyenne, les caractéristiques du sol, les précipitations et l'ensoleillement22. Par rapport aux études précédentes basées sur les méthodes SVM, RF et PLS-DA dans la classification des graines12, 18, nos résultats ont montré que le modèle MLP présentait d'excellentes performances, ce qui pourrait s'expliquer par le fait que les spectres NIR collectés étaient différents en termes de sensibilité au modèle en raison de différents produits chimiques. Composants.

Nous avons également trouvé des différences morphologiques entre deux sous-genres dans les images de pignons de pin. Les graines du sous-genre Strobus ont probablement une forme et une texture plus lisses que celles du sous-genre Pinus (Fig. 7), ce qui serait propice à l'extraction de caractéristiques du modèle d'apprentissage automatique. Des études antérieures ont montré que les modèles PLS-DA et IPLS-DA ont obtenu de bons résultats pour reconnaître les multiples variétés de deux espèces22. Cependant, nos résultats suggèrent que le modèle InceptionV3 a obtenu les meilleurs résultats sur les images de pignons de pin de sept espèces avec la vitesse de convergence la plus rapide et la plus grande précision. Le modèle similaire s'est avéré être utilisé avec succès pour le diagnostic des carences en éléments nutritifs dans le riz33 et la classification de plusieurs espèces de mauvaises herbes34. La précision de reconnaissance différente de plusieurs modèles peut être liée aux caractéristiques morphologiques (forme, couleur et texture) des noix entre les ensembles de données.

Les trois méthodes de reconnaissance des marqueurs moléculaires, NIR et images présentent des avantages différents (Fig. 5). En termes de précision, les marqueurs moléculaires ont des taux de reconnaissance plus élevés que le NIR et les images. Cependant, le marquage moléculaire prend beaucoup de temps, tout en étant limité par les équipements expérimentaux et les bases de données publiques de référence. En termes de coût, l'analyse d'images peut être meilleure, car elle est pratique, rapide et exempte de contraintes environnementales, mais cette méthode nécessite une grande quantité d'images et a un taux de reconnaissance plus faible. En termes de performances, la spectroscopie NIR peut être meilleure en raison de son taux de reconnaissance plus élevé et de la plus petite quantité de données générées, mais elle est coûteuse et nécessite des appareils spéciaux. À l'avenir, nous profiterions de l'approche d'apprentissage d'ensemble en fusionnant plusieurs caractéristiques de la molécule, du NIR et des images pour plus d'espèces.

Graphique en radar des coûts analytiques, de la complexité et des performances. Temps : le temps nécessaire aux analyses ; Coût : le coût financier de la réalisation des analyses ; Limitation : le degré de facteurs limitants des conditions expérimentales ; Capacité de données : la quantité de données obtenues à partir des analyses ; Exactitude : l'exactitude de l'identification. L'échelle représente ici la valeur avec 0 indiquant la valeur la plus basse et 1,0 indiquant la valeur la plus élevée.

Sur la base des résultats de la présente étude, cette étude vérifie l'application potentielle de modèles d'apprentissage automatique basés sur la spectroscopie NIR et les images à la reconnaissance parmi différentes espèces de pignons de pin. Nous avons collecté sept espèces de pignons de pin comme objet de recherche, construit des modèles de classification basés sur la spectroscopie NIR et les données d'image. Par rapport à différents modèles, il a été prouvé que MLP et InceptionV3 obtenaient un meilleur effet de classification. Dans le même temps, les bandes sensibles du NIR montrent la corrélation avec certaines vibrations moléculaires spéciales des groupes fonctionnels. Les résultats fourniront des solutions et des méthodes scientifiques pour la classification pratique, rapide et non destructive des différentes espèces de pignons de pin, et fourniront une nouvelle idée dans le domaine de la classification des espèces, ainsi qu'un schéma méthodologique et technique de référence.

L'autorisation académique de collecter et d'étudier les pignons de pin a été accordée par le directeur du Laboratoire clé de la conservation et de l'utilisation des ressources forestières des montagnes du sud-ouest, ministère de l'Éducation, Université forestière du sud-ouest. L'étude a respecté toutes les directives pertinentes.

Utilisé dans l'étude de P. bungeana | Junying Jiao 01 |, P. armandii | Institut de botanique de Kunming, Académie chinoise des sciences, ZuoZh271 |, P. yunnanensis | Institut de botanique de Kunming, Académie chinoise des sciences, MY259 |, P. thunbergia | Institut de botanique de Kunming, Académie chinoise des sciences, Lilan898 |, P. massoniana | Institut de botanique de Kunming, Académie chinoise des sciences, LWY2020020 |, P. elliottii | Junying Jiao 02 | et P. taiwanensis | Institut de botanique de Kunming, Académie chinoise des sciences, Jiangxc0597 | ont été préparés à partir de l'Institut de botanique de Kunming, de l'Académie chinoise des sciences et des usines de préparation des stations de travail des semis de la forêt du Yunnan. Les pignons de pin utilisés dans l'étude ont été formellement identifiés par Junying Jiao, directeur du Key Laboratory of Forest Resources Conservation and Utilization in Southwest Mountainous Region du ministère de l'Éducation, College of Forestry, Southwest Forestry University. P. bungeana et P. elliottii ont été enregistrés et conservés dans l'herbier de la Southwest Forestry University, avec le code d'accès : 0000651 et 0,000,652. P. armandi, P. yunnanensis, P. thunbergia, P. massoniana et P. taiwanensis ont été enregistrés et conservés dans la Germplasm Bank of Kunming Institute of Botany, Chinese Academy of Sciences, avec le code d'accès : ZuoZh271, MY259, Lilan898, LWY2020020 et Jiangxc0597.

Environ 1,5 kg de noix de chaque espèce ont été sélectionnés et soumis à un prétraitement pour des analyses d'image et de spectroscopie NIR. La surface de la graine a été rincée avec de l'eau distillée et les noix défectueuses ont été retirées. Les pignons de pin nettoyés ont ensuite été séchés dans un four (modèle DHG-9245A, Shanghai Hengke Instrument Co., Ltd., Shanghai, Chine) à 40 ° C pendant 8 h. Après le prétraitement, les noix ont été divisées au hasard en 30 groupes pour l'acquisition ultérieure des spectres NIR. Une ou deux noix de chaque groupe ont été photographiées pour obtenir les images d'origine (tableau 7).

Afin d'identifier les espèces de pignons de pin, les amorces de ITS2 et rbcL ont été conçues sur la base des séquences connues dans une étude précédente35 (Tableau 8). Les fragments de gènes ont été localisés et séquencés à l'aide d'un séquenceur ABI 3730. L'outil SeqMan a été utilisé pour assembler les fragments qui se chevauchent.

Les spectres NIR ont été acquis à l'aide du spectromètre Antaris Fourier Transform NIR (Thermo Fisher Scientific, Massachusetts, USA) équipé d'un détecteur InGaAs avec sphère d'intégration diffuse, d'une coupelle d'échantillonnage en quartz de 7,78 cm et d'une table rotative d'échantillon dans la plage de 12 800 à 3 800 cm− 1 (781 nm-2632 nm) à une résolution de 8 cm-1. Les échantillons ont été scannés 48 fois et 2335 bandes ont été obtenues. Les données ont été transformées en utilisant log(1/R) pour représenter l'absorbance.

Les spectres NIR ont été normalisés à l'aide d'une méthode de normalisation min-max pour éliminer les effets indésirables causés par les valeurs aberrantes. Les données originales ont été normalisées dans la plage de 0 et 1 à l'aide de l'équation. (1).

où x représente les valeurs d'absorbance, min(x) et max(x) représentent respectivement les valeurs d'absorbance les plus basses et les plus élevées.

Les images de pignons de pin ont été capturées à l'aide d'un microscope LEICA EZ4 avec un fond blanc et un grossissement octuple via un téléphone portable Huawei Mate 30 avec un appareil photo ultrasensible de 40 MP (grand angle, f/1.8) prenant en charge la mise au point automatique et la mise au point manuelle. L'angle de prise de vue a été réglé à 90°, la hauteur à 50 cm et 52 images ont été prises pour chaque espèce de pignon de pin.

Pendant le processus de capture d'image, des irrégularités surviennent. Ceux-ci incluent la variation de taille des pignons de pin, des positions incohérentes et l'apparence de la couleur, qui affecteront tous les modèles de reconnaissance et la précision de la classification. Ainsi, le prétraitement des images pour la standardisation impliquait les deux étapes suivantes :

(1) Détection des bords et écrêtage

La position du bord des pignons a été détectée avec la méthode Sobel sur la plateforme OpenCV. Une fois les sommets supérieur, inférieur, gauche et droit de la graine définis, l'image a été recadrée à travers un cadre matriciel reliant les quatre sommets (Fig. 6). Afin de maintenir un fond d'image uniforme (Fig. 6d), une découpe manuelle supplémentaire était parfois nécessaire (Fig. 6e).

Détection des bords Sobel et processus d'écrêtage.

(2) Augmentation des données et niveaux de gris de l'image

Les images découpées ont été orientées à l'aide des fonctions 'flip' et 'resize' dans OpenCV. La formule (2) a été utilisée pour transformer ces images alignées en images en niveaux de gris (Fig. 7). La fonction de conversion de couleur d'OpenCV a été utilisée dans cette étude : CV_BGR2GRAY pour effectuer le traitement en niveaux de gris de l'image.

Résultats du pré-traitement d'images pour les pignons de pin de chaque espèce. Les images ont été coupées, retournées, redimensionnées et transformées en couleur en niveaux de gris.

Afin d'étudier plus avant le modèle de classification des pignons de pin, deux approches expérimentales ont été utilisées (Fig. 8). Pour la première approche, des méthodes traditionnelles d'apprentissage automatique telles que DT, RF, MLP, SVM et NB ont été utilisées pour classer les noix sur la base de la spectroscopie NIR. Le modèle de classification basé sur les spectres NIR comprend cinq étapes (Fig. 8a). Les données ont d'abord été préparées puis divisées en un ensemble d'apprentissage et un ensemble de validation selon le ratio de 8:2. Les méthodes d'apprentissage DT, RF, MLP, SVM et NB ont ensuite été utilisées pour établir des modèles de classification. Suite à la formation et à la validation, la précision (Acc), Pré et F1 ont été sélectionnés comme indicateurs d'évaluation des performances de chaque modèle de classification.

Processus de conception expérimentale pour la reconnaissance d'images et la spectroscopie NIR. (a) Processus d'établissement d'un modèle de classification d'apprentissage automatique traditionnel à l'aide de données de spectroscopie NIR. (b) Processus d'établissement d'un modèle de classification d'apprentissage en profondeur à l'aide de données d'image.

La deuxième approche, cinq modèles CNN (VGG16, VGG19, Xception, InceptionV3 et ResNet50) ont été construits et entraînés pour classer les images de pignons de pin (Fig. 8b). Premièrement, les images originales de l'ensemble de données étaient de tailles différentes. Avant l'expérience, les images originales ont été prétraitées puis découpées en tailles 224 × 224. Deuxièmement, les images de pignons de pin ont été divisées en un ensemble d'apprentissage et un ensemble de validation selon le ratio de 8:2. Ensuite, les modèles VGG16, VGG19, Xception, ResNet50 et InceptionV3 ont été chargés sur la plateforme expérimentale pour apprentissage et validation. Les époques ont été fixées à 100 fois, la méthode d'optimisation Stochastic Gradient Descent (SGD) a été adoptée et le taux d'apprentissage initial a été fixé à 0,005. Le taux d'apprentissage change avec les tours d'entraînement, avec une atténuation de 1e-6 par tour, et le paramètre d'impulsion a été fixé à 0,9. La fonction de perte était sparse_categorical_crossentropy et la fonction d'activation était Rectified Linear Units (ReLU). Enfin, les Acc, Pre et F1 ont été sélectionnés pour l'évaluation du modèle.

Ces deux approches expérimentales ont été conçues pour comparer et analyser les performances de différents modèles afin d'évaluer lequel servirait le mieux les recherches futures sur la classification des pignons de pin. Les modèles CNN ont été construits à l'aide des bibliothèques Python Keras-nightly 2.6.0, TensorFlow-nightly-GPU 2.6.0 et Scikit-learn 0.24.2 exécutées dans Python v.3.7.

Les données et les codes présentés dans cette étude sont disponibles sur https://github.com/SWFU-JiangLiu/Recognition-of-pine-nuts.git. Les numéros d'accès GenBank sont OK271114-OK271122 et OK274058-OK274066.

Gernandt, DS, Lopez, GG, Garcia, SO & Liston, A. Phylogénie et classification des Pinus. Taxon 54, 29–42 (2005).

Article Google Scholar

Jin, WT et al. Les analyses phylogénomiques et écologiques révèlent l'évolution spatio-temporelle des pins dans le monde. Proc. Natl. Acad. Sci. États-Unis https://doi.org/10.1073/pnas.2022302118 (2021).

Article PubMed PubMed Central Google Scholar

Wang, Y. Fruits secs nutritifs et pignons de pin. Shanxi vieux 58, 58 (2016).

Guo, X. Pignons de pin d'hiver pour éliminer les maladies. Verdissement et vie 44, 44 (2014).

Zhu, D. et al. L'identification d'une seule variété de graines de soja par imagerie par rétrodiffusion de la lumière laser. Sens. Lett. 10, 399-404 (2012).

Article Google Scholar

Zhang, C. et al. Application de marqueurs SSR pour les tests de pureté du soja hybride commercial (Glycine max L.). J. Agric. Sci. Technol. 16, 1389-1396 (2014).

Google Scholar

Iqbal, A., Sadaqat, HA, Khan, AS et Amjad, M. Identification d'hybrides de tournesol (Helianthus annuus, Asteraceae) à l'aide de marqueurs de répétition à séquence simple. Genet. Mol. Rés. 10, 102–106. https://doi.org/10.4238/vol10-1gmr918 (2011).

Article CAS PubMed Google Scholar

Oliveira de Oliveira, L. et al. Marqueurs moléculaires chez Carya illinoinensis (Juglandaceae) : De la caractérisation génétique à la sélection moléculaire. J. Hortic. Sci. Biotechnol. 96, 560–569. https://doi.org/10.1080/14620316.2021.1892534 (2021).

Article CAS Google Scholar

Pandit, R., Travadi, T., Sharma, S., Joshi, C. & Joshi, M. Le méta-codage à barres d'ADN utilisant un mini-code à barres basé sur rbcL a révélé la présence d'espèces végétales non spécifiées dans les formulations polyherbales ayurvédiques. Phytochem. Anal. 32, 804–810. https://doi.org/10.1002/pca.3026 (2021).

Article CAS PubMed Google Scholar

Rao, P. et al. Identification variétale chez le riz (Oryza sativa) par des tests chimiques et électrophorèse sur gel de protéines de graines solubles. Indien J. Agric. Sci. 82, 304-311 (2012).

CAS Google Scholar

Peng, Z. et al. Application de la chromatographie liquide dénaturante à haute performance pour l'identification des variétés de riz et l'évaluation de la pureté des semences. Mol. Race. https://doi.org/10.1007/s11032-015-0429-8 (2016).

Article Google Scholar

Kong, W., Zhang, C., Liu, F., Nie, P. & He, Y. Identification de cultivars de graines de riz à l'aide de l'imagerie hyperspectrale dans le proche infrarouge et de l'analyse de données multivariées. Capteurs (Bâle) 13, 8916–8927. https://doi.org/10.3390/s130708916 (2013).

Annonces d'article Google Scholar

Yang, X., Hong, H., You, Z. & Cheng, F. Analyse spectrale et intégrée d'images de données hyperspectrales pour la classification des variétés de semences de maïs cireux. Capteurs (Bâle) 15, 15578–15594. https://doi.org/10.3390/s150715578 (2015).

Annonces d'article Google Scholar

Liu, J., Li, Z., Hu, F., Chen, T. & Zhu, A. Une méthode d'identification non destructive par spectroscopie THz pour les graines de coton transgéniques basée sur GA-SVM. Opter. Quant. Électron. 47, 313–322. https://doi.org/10.1007/s11082-014-9914-2 (2014).

Article CAS Google Scholar

Pourreza, A., Pourreza, H., Abbaspour-Fard, M.-H. & Sadrnia, H. Identification de neuf variétés de semences de blé iraniennes par analyse texturale avec traitement d'image. Calcul. Électron. Agric. 83, 102–108. https://doi.org/10.1016/j.compag.2012.02.005 (2012).

Article Google Scholar

Boelt, B. et al. Imagerie multispectrale : un nouvel outil pour l'évaluation de la qualité des semences ?. Semence Sci. Rés. 28, 222–228. https://doi.org/10.1017/s0960258518000235 (2018).

Article Google Scholar

Kandala, CVK, Govindarajan, KN, Puppala, N., Settaluri, V. & Reddy, RS Identification de variétés de blé avec un capteur capacitif à plaques parallèles à l'aide de l'analyse discriminante linéaire de Fisher. J. Sens. 1–5, 2014. https://doi.org/10.1155/2014/691898 (2014).

Article Google Scholar

Zhu, S. et al. Une méthode rapide et très efficace pour l'identification des variétés de graines de soja : images hyperspectrales combinées à l'apprentissage par transfert. Molécules 25, 152. https://doi.org/10.3390/molecules25010152 (2019).

Article CAS PubMed Central Google Scholar

ElMasry, G. et al. Utilisation de la vision par ordinateur et des techniques d'imagerie multispectrale pour la classification des graines de niébé (Vigna unguiculata). Plant Methods 15, 24. https://doi.org/10.1186/s13007-019-0411-2 (2019).

Article PubMed PubMed Central Google Scholar

Tigabu, M., Oden, PC et Lindgren, D. Identification des sources de graines et des parents de Pinus sylvestris L. à l'aide de spectres de réflectance visible-infrarouge proche et d'une analyse multivariée. Arbres 19, 468–476. https://doi.org/10.1007/s00468-005-0408-5 (2005).

Article Google Scholar

Loewe Munoz , V. , Balzarini , M. , Delard Rodriguez , C. , Alvarez Contreras , A. & Navarro-Cerrillo , RM Croissance du pin parasol ( Pinus pinea L. ) à partir de provenances européennes dans le centre du Chili . iForest Biogeosci. Pour. 10 , 64–6 https://doi.org/10.3832/ifor1984-009 (2017).

Article Google Scholar

Moscetti, R. et al. Reconnaissance des espèces de pignons par spectroscopie NIR et analyse d'images. J. Food Eng. 292, 110357. https://doi.org/10.1016/j.jfoodeng.2020.110357 (2021).

Article CAS Google Scholar

Shi, J., Liu, Z., Zhang, L., Zhou, W. et Huang, J. Reconnaissance hyperspectrale du riz endommagé par la machine à vecteur de support 013 à base de rouleaux de feuilles de riz. Menton. J. Rice Sci. 23, 331–334 (2009).

CAS Google Scholar

Xu, Z. et al. Détection des dommages causés par les promeneurs Dendrolimus punctatus basée sur l'analyse discriminante des pêcheurs et la forêt aléatoire. Spectrosc. Anale spectrale. 38, 2888–2896 (2018).

CAS Google Scholar

Rangarajan, AK, Purushothaman, R. & Ramesh, A. Classification des maladies des cultures de tomates à l'aide d'un algorithme d'apprentissage en profondeur pré-formé. Process Comput. Sci. 133, 1040-1047 (2018).

Article Google Scholar

Hridayami, P., Putra, IKGD & Wibawa, KS Reconnaissance des espèces de poissons à l'aide du réseau de neurones à convolution profonde VGG16. J. Comput. Sci. Ing. 13, 124–130. https://doi.org/10.5626/jcse.2019.13.3.124 (2019).

Article Google Scholar

Zhao, YJ, Cao, Y., Wang, J. et Xiong, Z. Séquençage du transcriptome de Pinus kesiya var. langbianensis et analyse comparative de la phylogénie des Pinus. BMC Genomics 19, 725. https://doi.org/10.1186/s12864-018-5127-6 (2018).

Article CAS PubMed PubMed Central Google Scholar

Herold, N., You, Y., Müller, RD & Seton, M. Sensibilité du modèle climatique aux changements de la paléotopographie du Miocène. Austral. J. Terre Sci. 56, 1049–1059. https://doi.org/10.1080/08120090903246170 (2009).

Article ADS CAS Google Scholar

Golonka, J. et al. Reconstitutions paléogéographiques et aménagement des bassins de l'Arctique. Mar. Animal de compagnie. Géol. 20, 211–248. https://doi.org/10.1016/s0264-8172(03)00043-6 (2003).

Article Google Scholar

Fidan, H. et al. Composition chimique de Pinus nigra Arn. graines non mûres de Bulgarie. Plantes https://doi.org/10.3390/plants11030245 (2022).

Article PubMed PubMed Central Google Scholar

Sahin, U., Anapali, O. & Ercisli, S. Propriétés physico-chimiques de certains substrats utilisés en horticulture. EUR. J. Hortic. Sci. 67, 55–60 (2002).

CAS Google Scholar

Liu, W. et al. Influence des facteurs environnementaux sur la production de substances actives et l'activité antioxydante chez Potentilla fruticosa L. et son évaluation de la qualité. Sci. Rep. 6, 28591. https://doi.org/10.1038/srep28591 (2016).

Article ADS CAS PubMed PubMed Central Google Scholar

Xu, Z. et al. Utilisation de réseaux de neurones à convolution profonde pour le diagnostic basé sur l'image des carences en nutriments dans le riz. Calcul. Renseignement. Neurosci. 2020, 7307252. https://doi.org/10.1155/2020/7307252 (2020).

Article PubMed PubMed Central Google Scholar

Olsen, A. et al. DeepWeeds : ensemble de données d'images d'espèces de mauvaises herbes multiclasses pour l'apprentissage en profondeur. Sci. Rep. 9, 2058. https://doi.org/10.1038/s41598-018-38343-3 (2019).

Article ADS CAS PubMed PubMed Central Google Scholar

Gong, H. et al. Identification microscopique et moléculaire des aiguilles de pin. J. Zhejiang Univ. (Sci. méd.) 47, 300–306 (2018).

Google Scholar

Télécharger les références

Ce travail est soutenu par Yunnan Zhuoyao Technology Company.

Ce travail a été soutenu par des projets de la National Natural Science Foundation (31960142); Laboratoire clé pour la conservation et l'utilisation des ressources forestières dans les montagnes du sud-ouest de la Chine, Ministère de l'éducation (KLESWFU-201905), Fondation de la recherche scientifique du Département de l'éducation du Yunnan (2022Y559) et Numérisation, développement et application des ressources biotiques (202002AA10007).

Ces auteurs ont contribué à parts égales : Biaosheng Huang et Jiang Liu.

College of Big Data and Intelligent Engineering, Southwest Forestry University, Kunming, 650224, Yunnan, Chine

Biaosheng Huang, Jiang Liu, Jing Lu, Danjv Lv, Jiawei Mao et Youjie Zhao

Laboratoire clé pour la conservation et l'utilisation des ressources forestières dans les montagnes du sud-ouest de la Chine, Ministère de l'éducation, Université forestière du sud-ouest, Kunming, 650224, Yunnan, Chine

Biaosheng Huang et Youjie Zhao

Collège de foresterie, Université forestière du sud-ouest, Kunming, 650224, Yunnan, Chine

Junying Jiao

Collège de mathématiques et de physique, Université forestière du sud-ouest, Kunming, 650224, Yunnan, Chine

Yan Zhang

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

BSH et JL (Jiang Liu) ont conçu cette étude et rédigé le texte principal du manuscrit. JYJ achetait et gardait les pignons de pin. JL (Jing Lu) et JWM ont collecté les données, les ont analysées et ont préparé des chiffres. YJZ et YZ ont aidé à interpréter les résultats. DJL, YJZ et YZ ont aidé à éditer la langue. Tous les auteurs ont contribué à l'interprétation des résultats et à la rédaction du manuscrit.

Correspondance avec Youjie Zhao ou Yan Zhang.

Les auteurs ne déclarent aucun intérêt concurrent.

Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournir un lien vers la licence Creative Commons et indiquer si des modifications ont été apportées. Les images ou tout autre matériel de tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Huang, B., Liu, J., Jiao, J. et al. Applications de l'apprentissage automatique dans la classification des pignons de pin. Sci Rep 12, 8799 (2022). https://doi.org/10.1038/s41598-022-12754-9

Télécharger la citation

Reçu : 18 novembre 2021

Accepté : 16 mai 2022

Publié: 25 mai 2022

DOI : https://doi.org/10.1038/s41598-022-12754-9

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

Méthodes d'analyse alimentaire (2023)

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.

PARTAGER