banner

Blog

Feb 17, 2024

Predecir las propiedades elásticas y plásticas de pequeños policristales de hierro mediante aprendizaje automático

Scientific Reports volumen 13, número de artículo: 13977 (2023) Citar este artículo

82 Accesos

4 altmétrico

Detalles de métricas

La deformación de materiales cristalinos es un ejemplo interesante de comportamiento de sistemas complejos. Las muestras pequeñas suelen exhibir una respuesta irregular de tipo estocástico a las tensiones aplicadas externamente, que se manifiesta como una variación significativa de una muestra a otra en sus propiedades mecánicas. En este trabajo estudiamos la previsibilidad de los módulos de corte dependientes de la muestra y los límites elásticos de un gran conjunto de pequeños policristales de hierro en forma de cubo generados por teselación de Voronoi, combinando simulaciones de dinámica molecular y aprendizaje automático. Entrenar una red neuronal convolucional para inferir el mapeo entre la estructura policristalina inicial de las muestras y las características de las curvas de tensión-deformación resultantes revela que el módulo de corte se puede predecir mejor que el límite elástico. Discutimos nuestros resultados en el contexto de la sensibilidad de la respuesta del sistema a pequeñas perturbaciones de su estado inicial.

Los materiales cristalinos estudiados en experimentos casi nunca son estructuras monocristalinas perfectas. La mayoría de las veces contienen defectos de red y suelen ser policristales, es decir, están compuestos por varios granos de diferentes orientaciones de red separados por límites de grano, que desempeñan un papel crucial en la determinación de las propiedades mecánicas de la muestra1. Durante su deformación, la complejidad de la dinámica del policristal a escala microscópica hace que predecir la respuesta mecánica de una sola muestra en función de su estado inicial (microestructura) sea un desafío. Además, la plasticidad del cristal exhibe efectos de tamaño, lo que implica que los sistemas más pequeños son más fuertes (la tensión requerida para alcanzar una deformación determinada es mayor) y su respuesta mecánica a las tensiones aplicadas externamente tiende a ser irregular y se caracteriza por una variación significativa de una muestra a otra2. ,3. Estas últimas características se originan en la microestructura de pequeños policristales que depende de la muestra, lo que implica que predecir su respuesta mecánica probablemente sea particularmente desafiante.

En los últimos años se ha observado un enorme progreso en el desarrollo y aplicación de técnicas de aprendizaje automático (ML) en muchos campos de la ciencia4,5,6,7,8,9. En la ciencia de los materiales, ha llevado a la aparición de métodos capaces de identificar y caracterizar muestras10,11,12, diseñar nuevos materiales con las propiedades deseadas13,14,15,16 y establecer relaciones entre la estructura y las propiedades del material17,18. ,19,20. Un problema de investigación relacionado, relevante para el presente estudio, es predecir la respuesta mecánica de una muestra de material durante su deformación21,22,23. El planteamiento general del problema se puede formular de la siguiente manera: Dada alguna descripción del estado inicial (microestructura) de la muestra, ¿con qué precisión se puede predecir su respuesta mecánica?

La precisión de la predicción del algoritmo ML dado se puede expresar cuantitativamente, por ejemplo, mediante el coeficiente de determinación \(r^2\). Si el sistema estudiado se rige por ecuaciones deterministas de movimiento, en principio debería ser posible entrenar un algoritmo para representar perfectamente su dinámica, lo que daría como resultado una puntuación de previsibilidad perfecta \(r^2=1\). En la práctica, sin embargo, esto no suele suceder. La dinámica de muchos sistemas complejos es hasta cierto punto caótica o, como en el caso de la dinámica de dislocaciones, exhibe un comportamiento crítico24,25,26,27,28. Esto implica que la evolución temporal de un sistema complejo, como un pequeño cristal que se deforma plásticamente, puede ser sensible a pequeñas perturbaciones de sus condiciones iniciales. En otras palabras, perturbar ligeramente el estado inicial del sistema puede provocar diferencias significativas en su dinámica posterior. Esto limita el grado en que se puede predecir la evolución temporal de tales sistemas (por ejemplo, mediante algoritmos ML) porque la información completa del estado inicial, que en la escala atómica incluye posiciones y velocidades de todos los átomos, generalmente no está disponible debido a a la precisión finita de cualquier observación experimental o representaciones numéricas generales de los datos. Además, debido a la precisión decimal finita, las simulaciones numéricas tampoco son perfectamente precisas, algo que puede amplificar aún más las diferencias causadas por pequeñas perturbaciones del estado inicial. Este estudio se refiere únicamente a simulaciones por computadora, pero como se discutió anteriormente, la falta de una descripción completa del estado inicial también existe en experimentos, donde cualquier caracterización de la microestructura inicial (usando varias técnicas de imagen) tiene una precisión finita.

ML ha estudiado los policristales en varias publicaciones29,30,31,32,33, donde se utilizaron datos experimentales y simulaciones de elementos finitos para producir los datos de entrenamiento. Por el contrario, en este trabajo, estudiamos la previsibilidad del proceso de deformación de nanopolicristales de hierro en forma de cubo combinando simulaciones de dinámica molecular (MD) controladas por tensión con métodos ML. El empleo de simulaciones MD permite tener en cuenta detalles atomísticos de la estructura, lo cual es especialmente importante en policristales debido a la existencia de límites de grano. Generamos un gran conjunto de policristales con varias formas y tamaños de granos y lo usamos para entrenar una red neuronal convolucional (CNN) para inferir el vínculo entre la microestructura inicial y las características de la curva tensión-deformación. Nuestro estudio se centra en una morfología específica de los policristales, ya que para su generación utilizamos la teselación de Voronoi. Mostramos que las propiedades elásticas y plásticas clave que caracterizan la respuesta del sistema a los esfuerzos cortantes aplicados, a saber, el módulo de corte y el límite elástico, exhiben diferentes grados de previsibilidad, medidos aquí por el coeficiente de determinación \(r^2\). Como descriptores de CNN utilizamos campos que describen las propiedades locales de los policristales a nivel atómico. El grado de previsibilidad que encontramos para estas cantidades se analiza luego en el contexto de la sensibilidad del sistema a pequeñas perturbaciones de las condiciones iniciales. Proponemos que la sensibilidad es un factor importante que da lugar a límites fundamentales a la previsibilidad de la evolución de sistemas complejos, como la previsibilidad de la deformación.

Esquema del modelo estudiado en el trabajo. La muestra policristalina primero se equilibra a 300 K (izquierda), después de lo cual se deforma mediante simulaciones MD con una tasa de deformación constante (centro). Durante la simulación, la tensión cortante instantánea \(\sigma\) se mide como una función de la deformación \(\epsilon\), lo que da como resultado una curva tensión-deformación \(\sigma (\epsilon )\) única para cada muestra. Repetir la simulación varias veces para diferentes estructuras policristalinas iniciales da como resultado un conjunto de curvas de tensión-deformación con una media mostrada como línea negra y una desviación estándar mostrada en gris (derecha).

Esquema de la CNN utilizada para predecir el módulo de corte y el límite elástico del policristal. Las matrices tridimensionales que representan la orientación cristalográfica local y los límites de grano del policristal se introducen en capas convolucionales tridimensionales, donde son procesadas por los filtros convolucionales. Diferentes colores representan diferentes filtros. Posteriormente, el tamaño de las matrices se reduce mediante la capa de agrupación máxima. El procedimiento se repite hasta que las matrices tengan el tamaño \(1\times 1\times 1\). Luego se concatenan y se introducen en la red neuronal completamente conectada, que proporciona el resultado final, es decir, módulo de corte, límite elástico según una de las definiciones indicadas en el panel derecho, estrés con un valor de deformación fijo o límite elástico. Los valores porcentuales se refieren al método de rendimiento compensado.

Primero se genera un conjunto de 4000 configuraciones iniciales policristalinas de hierro en forma de cubo con teselación de Voronoi. El tamaño de la muestra es \(20\times 20\times 20\) \(\hbox {nm}^{3}\) y todas las muestras contienen 8 nanogranos de un tamaño promedio de 10 nm con posiciones de las semillas elegidas al azar en Voronoi. teselación y ángulos de Euler que especifican la orientación de la red cristalográfica. Aunque tanto el tamaño del nanocristal como el número de nanogranos son fijos, los granos individuales tienen diferentes formas y tamaños y, por lo tanto, la fracción de volumen del límite entre ellos también varía de una muestra a otra. La estructura reticular es bcc y la constante reticular se elige como 0,287 nm. Cada configuración contiene alrededor de 677.000 átomos. Se pueden encontrar más detalles sobre la generación de policristales de hierro en la sección Métodos "Generación de policristales".

Una vez generado el conjunto de configuraciones policristalinas iniciales, su energía se minimiza primero ajustando las coordenadas de los átomos y luego se equilibran a 300 K. Durante esas fases, los límites de grano inicialmente agudos, generados por la teselación de Voronoi, se transforman ligeramente mediante un reordenamiento atómico local. Posteriormente, las simulaciones MD de la deformación por corte se llevan a cabo para cada uno de ellos mediante el simulador atómico/molecular masivo paralelo a gran escala (LAMMPS)34 (consulte la sección de Métodos "Simulaciones de dinámica molecular" para más detalles), lo que permite obtener la tensión específica de la muestra. -Curva de deformación para cada muestra. El modelo se muestra esquemáticamente junto con algunos ejemplos correspondientes de curvas tensión-deformación en la Fig. 1. Como se puede observar allí, las curvas exhiben una gran variabilidad entre muestras. Si bien la parte elástica de diferentes curvas es similar (pero no igual), aumentando linealmente con una cierta pendiente cuya magnitud varía de una muestra a otra, en el régimen plástico, que típicamente comienza alrededor del valor de deformación de 0,09, existen grandes diferencias en la respuesta al estrés y las curvas exhiben un carácter fluctuante con muchas caídas de estrés. También se puede observar que diferentes curvas exhiben un comportamiento cualitativamente diferente. Algunos de ellos tienen una gran caída de tensión en algún valor de deformación, mientras que otros después de alcanzar el rendimiento permanecen relativamente estables. Como consecuencia, el límite elástico muestra una variabilidad mucho mayor que el módulo de corte.

Para cada configuración, el módulo de corte y los esfuerzos de fluencia (usando diferentes definiciones, ver más abajo) se extraen de las curvas de tensión-deformación correspondientes obtenidas durante la simulación. El módulo de corte se toma como la pendiente de la función lineal ajustada con el método de mínimos cuadrados a la curva tensión-deformación en el rango de deformación de 0 a 0,01, en el que el sistema todavía está en régimen elástico. Por otro lado, para extraer el límite elástico se aplican varias definiciones diferentes, que se analizan a continuación.

A medida que los descriptores ingresan, los campos que representan la orientación de la red local y la densidad de los átomos en el límite del grano se extraen con diferentes resoluciones de las configuraciones equilibradas. Junto con los valores de salida del módulo de corte y el límite elástico extraídos de las curvas tensión-deformación, se utilizan posteriormente para entrenar CNN. El esquema de la CNN se muestra en la Fig. 2 (consulte la sección de Métodos "Descriptores" para obtener detalles sobre los descriptores y la sección de Métodos "Redes neuronales convolucionales" para obtener detalles sobre la arquitectura de CNN). La previsibilidad se mide como el coeficiente de determinación \(r^2\) en función del tamaño del conjunto de datos N, dado por

donde \(y_i\) es el valor verdadero del módulo de corte o límite elástico de la muestra i, \(\langle y \rangle\) es el valor medio, \(f_i\) es el valor predicho por la CNN y N es el número total de muestras en el conjunto dado. El coeficiente de determinación es una métrica comúnmente utilizada para evaluar la calidad del análisis de regresión y puede interpretarse como la proporción de la varianza en la variable dependiente (predicha) que se predice a partir de las variables independientes (entrada)35.

Se dice que un material está en régimen elástico cuando vuelve a su forma y tamaño originales después de que se elimina la tensión aplicada externamente. La elasticidad se caracteriza cuantitativamente por un conjunto de constantes elásticas, como el módulo de Young, el módulo de volumen o el módulo de corte, que indican qué cantidad de tensión se necesita para deformar la muestra de una determinada manera. Esas constantes se pueden escribir en forma de tensor de elasticidad.

Si bien las constantes elásticas de los monocristales son conocidas para la mayoría de los materiales, en el caso de muestras policristalinas dependen de la forma y orientación cristalográfica de cada grano constituyente36. Las constantes elásticas de esos granos individuales corresponden a la transformación rotacional del tensor de elasticidad obtenido para los principales ejes cristalográficos. Además, en la muestra policristalina equilibrada la orientación cristalográfica puede ser diferente cerca de los límites de los granos que dentro de los granos, lo que también puede influir en las propiedades elásticas de todo el material. Por lo tanto, se puede esperar que el módulo de corte de todo el policristal pueda extraerse con una precisión razonable del campo de orientación cristalográfica que varía dentro de la muestra.

En la Fig. 3, se muestra el coeficiente de determinación \(r^2\) para el módulo de corte en función del tamaño del conjunto de datos N utilizado como entrada para entrenar la CNN. La previsibilidad ya es buena incluso para los valores más pequeños de N. Agregar más configuraciones la aumenta aún más y reduce la brecha entre el conjunto de pruebas y entrenamiento \(\delta\) como se ve en los recuadros. Además, se puede ver que aumentar la resolución de los datos de entrada también mejora la previsibilidad. Si bien la diferencia en \(r^2\) entre las resoluciones de \(16\times 16\times 16\) y \(32\times 32\times 32\) es bastante significativa, los resultados no mejoran mucho más cuando la resolución aumenta aún más hasta \(64\times 64\times 64\). En la Fig. 4a se muestra el diagrama de dispersión de los valores verdaderos frente a los valores predichos del módulo de corte para una de las semillas con la resolución de los descriptores \(32\times 32\times 32\). La figura 5 muestra \(r^2\) del conjunto de prueba para el módulo de corte en función del tamaño inverso del conjunto de datos, 1/N, con una función lineal ajustada a los puntos. Permite estimar el valor asintótico de \(r^2\) para \(N\rightarrow \infty\).

Además, los valores de \(r^2\) resultantes del entrenamiento con solo uno de los descriptores comparados con \(r^2\) para ambos descriptores combinados se muestran en la Fig. 6 para la resolución \(32\times 32\). multiplicado por 32\). Como se puede ver allí, la orientación reticular de los granos individuales del policristal es un descriptor más importante para predecir el módulo de corte que el límite del grano. Los valores de \(r^2\) para este último descriptor son, de hecho, ligeramente negativos, lo que sugiere que por sí solo no proporciona ninguna información sobre el módulo de corte. Sin embargo, \(r^2\) para ambos descriptores combinados sigue siendo ligeramente superior al de la orientación reticular sólo en casi todo el rango de N. Esto sugiere que el descriptor del límite de grano puede, de hecho, contener alguna información relevante para el módulo de corte pero sólo en combinación con el otro descriptor.

\(r^2\) para el módulo de corte obtenido para tres resoluciones diferentes de los datos de entrada de CNN en función de N. Las líneas discontinuas muestran los valores de \(r^2\) para el conjunto de entrenamiento, y las líneas continuas para el conjunto de prueba. El recuadro muestra \(\delta\) en función de N. Las barras de error son errores estándar de la media (SEM).

Diagramas de dispersión de los valores reales de las cantidades estudiadas en el trabajo frente a los valores correspondientes predichos por la CNN para una sola semilla con la resolución de los descriptores \(32\times 32\times 32\).

Comportamiento asintótico de \(r^2\) del conjunto de prueba para el módulo de corte obtenido para tres resoluciones diferentes de los datos de entrada de CNN en función de 1/N. Las barras de error son errores estándar de la media (SEM).

\(r^2\) para el módulo de corte obtenido para el conjunto de prueba con la resolución \(32\times 32\times 32\) con los descriptores utilizados por separado y combinados como una función de N. Las barras de error son errores estándar de la media (SEM).

Los cristales se deforman plásticamente cuando no vuelven a su forma original si se elimina la tensión externa. Mientras que un deslizamiento cristalino perfecto, que es el desplazamiento de dos capas atómicas entre sí, requeriría una gran cantidad de tensión, la plasticidad en los cristales reales se ve facilitada por los defectos. Muy a menudo la plasticidad está mediada por el movimiento de dislocaciones. En los policristales estudiados aquí no hay dislocaciones presentes dentro de los granos en la configuración inicial; sin embargo, los límites de los granos con ángulos de desorientación bajos pueden considerarse como conjuntos de dislocaciones. Los policristales se deforman con mayor frecuencia mediante nucleación de dislocaciones de los límites de grano y por deslizamiento de los límites de grano 37,38.

El rendimiento del material es el punto de la curva tensión-deformación que indica la transición del comportamiento elástico al plástico. Una vez que la muestra entra en régimen plástico se deforma permanentemente. El límite elástico se especifica completamente dando sus dos coordenadas, denominadas deformación elástica y límite elástico. Hay varias formas de determinar con precisión la posición del límite elástico.

En los metales, el límite elástico se define mediante el método de compensación39. En ese enfoque, el rendimiento se determina como la intersección de la curva tensión-deformación con la línea paralela a la región de elasticidad. El desplazamiento mediante el cual se desplaza esa línea puede variar según el material específico. Generalmente se elige como 0,002 (0,2%) de deformación39,40, sin embargo, ese valor no es particularmente útil en este trabajo porque el punto de intersección determinado con él se encuentra dentro de la parte elástica de la curva tensión-deformación. Se ha demostrado que los policristales nanocristalinos se deforman de forma más heterogénea y, por lo tanto, no todos los granos se deforman en absoluto con la tensión de compensación del 0,2%41,42. Por lo tanto, en este trabajo se eligen los valores de compensación 0,01 (1%) y 0,02 (2%). El método se ilustra en el panel derecho de la Fig. 2. Como se puede ver allí, el valor de compensación para el 1% todavía está en el régimen pseudoelástico, que corresponde simplemente al ablandamiento por deformación de la muestra. Sin embargo, el punto determinado con ese método para el 2% se ubica ligeramente detrás del primer cambio abrupto en la pendiente de la curva tensión-deformación. El límite elástico determinado por el método de compensación se puede interpretar como el estado de deformación plástica del sistema por el valor especificado por la compensación.

También puede interesarnos el esfuerzo máximo que la muestra puede soportar43,44, que corresponde al máximo global de la curva tensión-deformación. Sin embargo, en el caso de curvas tensión-deformación irregulares y altamente fluctuantes, como las que ocurren en muestras pequeñas, esa definición podría no ser apropiada como definición del límite elástico.

También se puede considerar el valor de la tensión en alguna deformación fija, que a veces se define como la tensión de flujo45,46. El valor exacto de la deformación debe elegirse de forma que el sistema ya esté deformado plásticamente. Si observamos la curva tensión-deformación promedio en la Fig. 1, un valor apropiado de deformación a elegir está aproximadamente en el rango de 0,075 a 0,1.

\(r^2\) para el límite elástico definido con el método de compensación al 2% obtenido para tres resoluciones diferentes de los datos de entrada de CNN en función de N. Las líneas discontinuas muestran los valores de \(r^2\) para el conjunto de entrenamiento y las líneas continuas para el conjunto de prueba. Las barras de error son errores estándar de la media (SEM). El recuadro muestra \(\delta\) en función del tamaño del conjunto de datos.

Comportamiento asintótico de \(r^2\) del conjunto de prueba para el límite elástico definido con el método de compensación al 2% obtenido para tres resoluciones diferentes de los datos de entrada de CNN en función de 1/N. Las barras de error son errores estándar de la media (SEM).

\(r^2\) para el límite elástico definido con el método de compensación al 2% obtenido para el conjunto de prueba con la resolución \(32\times 32\times 32\) con los descriptores utilizados por separado y combinados. Las barras de error son errores estándar de la media (SEM).

\(r^2\) para el límite elástico definido con el método de compensación para la resolución de \(32\times 32\times 32\) de los datos de entrada de CNN en función de N. Las líneas discontinuas muestran los valores de \ (r^2\) para el conjunto de entrenamiento y las líneas continuas para el conjunto de prueba. El recuadro muestra \(\delta\) en función de N. Las barras de error son errores estándar de la media (SEM).

Comportamiento asintótico de \(r^2\) del conjunto de prueba para el límite elástico definido con el método de compensación para la resolución de \(32\times 32\times 32\) de los datos de entrada de CNN en función de 1/N . El recuadro muestra \(\delta\) en función de N. Las barras de error son errores estándar de la media (SEM).

\(r^2\) para el valor de tensión máximo a lo largo de la curva tensión-deformación obtenida para tres resoluciones diferentes de los datos de entrada de CNN en función de N. Las líneas discontinuas muestran los valores de \(r^2\) para conjunto de entrenamiento y las líneas continuas para el conjunto de prueba. Las barras de error son errores estándar de la media (SEM). El recuadro muestra \(\delta\) en función del tamaño del conjunto de datos.

Comportamiento asintótico de \(r^2\) del conjunto de prueba para el valor de tensión máximo a lo largo de la curva tensión-deformación obtenida para tres resoluciones diferentes de los datos de entrada de CNN en función de 1/N. Las barras de error son errores estándar de la media (SEM).

\(r^2\) para el valor de tensión máximo a lo largo de la curva tensión-deformación obtenida para la prueba establecida en la resolución \(32\times 32\times 32\) con los descriptores utilizados por separado y combinados. Las barras de error son errores estándar de la media (SEM).

En la Fig. 7\(r^2\) se muestra el límite elástico obtenido con el valor de compensación del 2% para tres resoluciones diferentes en función de N (con un espaciado de 500 configuraciones). \(r^2\) es significativamente menor que en el caso del módulo de corte y \(\delta\) es ligeramente mayor. De manera similar al módulo de corte, la previsibilidad del límite elástico compensado aumenta con la resolución y el aumento más significativo en \(r^2\) ocurre entre \(16\times 16\times 16\) y \(32\times 32\). \veces 32\). Aumentar aún más la resolución a \(64\times 64\times 64\) no mejora significativamente la previsibilidad. Para todas las resoluciones \(r^2\) aumenta con N y \(\delta\) se vuelve más pequeño. De acuerdo con el comportamiento asintótico mostrado en la Fig. 8, el valor de \(r^2\) del conjunto de prueba en \(N\rightarrow \infty\) también es mayor para las resoluciones \(32\times 32\times 32\). ) y \(64\times 64\times 64\) que \(16\times 16\times 16\).

En la Fig. 9 se muestran los valores de \(r^2\) para el límite elástico obtenidos con una compensación del 2% para los descriptores separados. En contraste con el módulo de corte para esta definición del límite elástico, el límite de grano es un descriptor más importante que la orientación de la red. Sin embargo, la importancia del primero aumenta con el tamaño del conjunto de datos N.

El coeficiente de determinación \(r^2\) en \(32\times 32\times 32\) para el límite elástico para una compensación del 2% se compara en la Fig. 10 con el obtenido para una compensación del 1%. Se puede observar que la previsibilidad es similar para ambos valores del desplazamiento y \(r^2\) para el conjunto de prueba alcanza 0,6 para el conjunto de datos completo. \(\delta\) se reduce al aumentar N en ambos casos. El comportamiento asintótico que se muestra en la Fig. 11 indica que los valores de \(r^2\) están muy cerca entre sí para \(N\rightarrow \infty\). Nuevamente, los diagramas de dispersión correspondientes de los valores verdaderos frente a los predichos para esos dos casos se muestran en las figuras 4b y c. De acuerdo con la diferencia entre los valores de \(r^2\), se puede observar que la dispersión del límite elástico es significativamente mayor que la del módulo de corte.

El coeficiente de determinación \(r^2\) para el conjunto de entrenamiento y prueba, obtenido de las CNN entrenadas para el valor de tensión máximo, se muestra en la Fig. 12, nuevamente en tres resoluciones diferentes de los datos de entrada. En cuanto a la definición de compensación, se puede observar que tanto para el conjunto de entrenamiento como para el de prueba el valor de \(r^2\) aumenta con N. Los resultados son similares para todas las resoluciones estudiadas. Los recuadros muestran que \(\delta\) disminuye al aumentar N. El comportamiento asintótico correspondiente se puede ver en la Fig. 13 y el diagrama de dispersión correspondiente de los valores verdaderos frente a los predichos se puede ver en la Fig. 4d.

\(r^2\) para la tensión en el valor de deformación fijo de 0,075 (a) y 0,1 (b), obtenido para la resolución \(32\times 32\times 32\) de los datos de entrada de CNN, mostrados como función de N. Las barras de error son errores estándar de la media (SEM). Los recuadros muestran \(\delta\) en función de N.

Comportamiento asintótico de \(r^2\) del conjunto de prueba para la tensión en el valor de deformación fijo de 0,075 y 0,1, obtenido para la resolución \(32\times 32\times 32\) de los datos de entrada de CNN, que se muestra como una función de 1/N. Las barras de error son errores estándar de la media (SEM).

Nuevamente, los valores de \(r^2\) obtenidos para los descriptores separados en comparación con su uso conjunto se muestran en la Fig. 14. También esta vez se puede ver que el límite de grano es un descriptor más importante que la orientación de la red. Sin embargo, ambos descriptores proporcionan información significativa sobre el límite elástico para todos los valores N considerados. El valor de \(r^2\) para la combinación de descriptores también es significativamente mayor que para cualquiera de los descriptores utilizados por separado.

En la Fig. 15 se muestra el coeficiente de determinación del valor de tensión para los valores de deformación fijos de 0,075 y 0,1. Para todos los valores N considerados, \(r^2\) es mayor para el valor de deformación más bajo. Esto es de esperarse ya que el punto correspondiente de la curva tensión-deformación se encuentra más cerca de la parte elástica y, como se vio anteriormente, las propiedades elásticas se predicen mucho más fácilmente que las propiedades plásticas. Los diagramas de dispersión de los valores verdaderos frente a los predichos en las figuras 4e yf sugieren que la CNN sobreestima los valores bajos de tensión con una deformación de 0,1, mientras que los altos se subestiman. Además, el comportamiento asintótico que se muestra en la Fig. 16 indica que \(r^2\) es mucho mayor para el valor de deformación de 0,075 que para 0,1.

\(r^2\) para la tensión de rendimiento definida con el método de compensación para la resolución de \(32\times 32\times 32\) de los datos de entrada de CNN en función de N. Las líneas discontinuas muestran los valores de \ (r^2\) para el conjunto de entrenamiento y las líneas continuas para el conjunto de prueba. Las barras de error son errores estándar de la media (SEM). El recuadro muestra \(\delta\) en función de N.

Comportamiento asintótico de \(r^2\) del conjunto de pruebas para la deformación de fluencia definida con el método de compensación para la resolución de \(32\times 32\times 32\) de los datos de entrada de CNN en función de 1/N con el rango de ajuste (0;0.001). Las barras de error son errores estándar de la media (SEM).

Además del límite elástico, también se puede entrenar la CNN para predecir la tensión elástica. Obviamente, sólo tiene sentido para las definiciones en las que el límite elástico no se determina en el valor fijo de deformación. Además, resulta que la predicción es muy pobre para el límite elástico definido como la tensión máxima de la curva tensión-deformación. Lo más probable es que esto se deba al hecho de que, si bien el valor máximo de tensión está determinado hasta cierto punto por la estructura del policristal, el valor de deformación al que se alcanza este máximo es en gran medida aleatorio debido al carácter fluctuante de la relación tensión-deformación. curva. Por lo tanto, la única definición para la cual se presentan los resultados de la predicción es aquella que emplea el método de compensación. \(r^2\) obtenido con ese método se muestra en la Fig. 17, nuevamente para los valores de compensación de 1% y 2%, los diagramas de dispersión de los valores verdaderos frente a los predichos se muestran en las Fig. 4g y h y el comportamiento asintótico correspondiente. se muestra en la Fig. 18; sin embargo, el rango de ajuste para la función lineal es (0; 0,001) debido a que los puntos con N bajo son valores atípicos.

En todos los casos estudiados el valor de \(r^2\) es inferior a 1, lo que implica que la previsibilidad nunca es perfecta. Aunque \(r^2\) para el conjunto de prueba tiende a aumentar con N (y con la resolución) a medida que se cierra la brecha entre el conjunto de entrenamiento y el de prueba, para ambos conjuntos \(r^2\) parece acercarse a un cierto valor por debajo de 1. Esto sugiere que existe un cierto límite para la previsibilidad de las propiedades elásticas y plásticas de las pequeñas muestras policristalinas que estudiamos. Este límite podría estar relacionado con propiedades fundamentales del sistema que se manifiestan como la sensibilidad de la respuesta mecánica a pequeñas variaciones en las condiciones iniciales de las muestras, no capturadas adecuadamente por los descriptores dados con una resolución finita.

Se ha visto que la previsibilidad del módulo de corte es mayor que la del límite elástico. Además, diferentes definiciones del límite elástico dieron como resultado diferentes valores de \(r^2\). Como ya se muestra en la Fig. 1, las curvas tensión-deformación exhiben una mayor variabilidad cerca del límite elástico que en el régimen elástico. Sin embargo, esto no explica directamente la diferencia en los valores de las puntuaciones de previsibilidad entre el módulo de corte y el límite elástico, ya que según la Ec. (1) la previsibilidad se mide como la precisión del ajuste en relación con la varianza de la cantidad que se predice. Por lo tanto, las cantidades a priori que exhiben una mayor variabilidad no deberían ser más difíciles de predecir.

Por otro lado, estudiar el grado de sensibilidad de la dinámica de deformación del sistema a pequeñas perturbaciones de las condiciones iniciales podría darnos una idea de los límites de la previsibilidad. Hay varias formas en que dicha sensibilidad puede limitar la puntuación de previsibilidad. En primer lugar, las velocidades de las partículas del sistema se inicializan aleatoriamente. Los valores de esas velocidades no son parte de los descriptores introducidos en el algoritmo; sin embargo, se puede esperar que puedan influir en los detalles de la dinámica del sistema, algo que podría resultar en cambios en la curva tensión-deformación a partir de la cual todos Se extraen las cantidades discutidas en este trabajo en el contexto de la previsibilidad. Además, el sistema puede ser sensible a la elección inicial de los parámetros en la teselación de Voronoi, es decir, la posición de los nodos, que especifican las formas de los granos, y los ángulos de rotación de la red. Dado que esas características del sistema se proporcionan a la CNN con una resolución finita, es posible que pequeñas variaciones en las formas de los granos y las rotaciones de la red no produzcan cambios en los descriptores. Finalmente, las simulaciones por computadora se realizan con precisión decimal finita, lo que conduce a imprecisiones en la integración de las ecuaciones de movimiento. Todos esos factores pueden contribuir a un límite de la previsibilidad.

Para estudiar cuantitativamente la sensibilidad del sistema a las condiciones iniciales se han llevado a cabo nuevas simulaciones MD utilizando como estado inicial conjuntos de configuraciones en las que se cumple una de las características descritas anteriormente (semilla aleatoria, posición de los nodos de Voronoi y orientación de la red). es variado mientras que los restantes se mantienen iguales. Para que los resultados sean representativos de todo el conjunto de datos, se seleccionaron 15 configuraciones del conjunto original y para cada una de ellas y para cada una de las características se ejecutaron 49 nuevas simulaciones (lo que da como resultado 50 curvas de tensión-deformación, incluida la no perturbada). Para medir la sensibilidad cuantitativamente, se debe relacionar la varianza de la respuesta del sistema, por ejemplo la tensión en una deformación dada o el módulo de corte, medido aquí para diferentes semillas aleatorias, con la varianza de la misma respuesta para todo el conjunto original de configuraciones. La sensibilidad \(\chi\) (que se toma como función de la perturbación \(\varvec{\alpha }\)) puede por tanto definirse como

El denominador es la varianza de la cantidad y sobre todo el conjunto original de configuraciones, mientras que el denominador es el promedio de las varianzas de la misma cantidad determinada para las configuraciones perturbadas con la magnitud \(\varvec{\alpha }\) sobre el conjunto de las configuraciones seleccionadas para el análisis de sensibilidad enumeradas con el índice i. La magnitud de la perturbación se puede escribir como

donde \(\Delta\) denota la desviación estándar, x, y y z son las posiciones de los nodos, y \(\psi\), \(\theta\) y \(\phi\) son los ángulos de Euler correspondientes a las rotaciones de los granos. \(\varvec{\alpha }_j\) es la realización específica de la perturbación con la magnitud \(\varvec{\alpha }\). \(\varvec{\alpha }=(0,0,0,0,0,0)\) implica que cambiar la semilla aleatoria es la única perturbación realizada.

Es fácil ver que la definición de sensibilidad en la Ec. (2) es similar a la relación de las varianzas en la definición de \(r^2\) en la ecuación. (1). Ambas cantidades relacionan la dispersión de los valores obtenidos en algún procedimiento con la dispersión de los valores de referencia del sistema. Se puede esperar que para \(\varvec{\alpha }\) suficientemente bajo en el caso en que la sensibilidad sea el único factor que limita la previsibilidad, \(\chi =1-r^2\). Dado que siempre hay otros factores que limitan la previsibilidad (como un conjunto de datos limitado, la convergencia del entrenamiento del algoritmo ML, su complejidad, la elección de descriptores), en la práctica uno tiene \(\chi <1-r^2\).

Para establecer la dependencia de la sensibilidad con la magnitud de la perturbación, se realizaron simulaciones MD para configuraciones con diferentes valores de \(\varvec{\alpha }\). Para 15 configuraciones seleccionadas del conjunto original, se generaron 49 configuraciones perturbadas con \(\varvec{(}3\)Å\(,3^{\circ })\). Para todos ellos se realizaron nuevas simulaciones MD, para cada una de las cuales se utilizó una semilla aleatoria diferente. Se realizó el mismo número de simulaciones para las configuraciones no perturbadas cambiando solo la semilla aleatoria. Además, se seleccionaron y perturbaron tres configuraciones desplazando simultáneamente los nodos y rotando la orientación de la red con \(\varvec{\alpha }=(2\)Å\(,2^{\circ })\) en un conjunto, y \(\varvec{\alpha }=(1\)Å\(,1^{\circ })\) en el otro conjunto. Para una configuración elegida, las correspondientes curvas tensión-deformación promediadas junto con su dispersión se muestran en la Fig. 19 para diferentes magnitudes de perturbación \(\varvec{\alpha }\). Como se puede ver allí, la desviación estándar de la respuesta al estrés aumenta con \(\varvec{\alpha }\), sin embargo, en el rango de \(\varvec{\alpha }\) que se muestra en el recuadro, difiere como máximo en un factor de 2. Por lo tanto, debido a la débil dependencia de \(\varvec{\alpha }\), en la discusión siguiente \(\chi (3\)Å\(,3^{\circ })\) ser usado.

A continuación se analiza la sensibilidad del sistema a perturbaciones de diferentes condiciones iniciales. Los valores extraídos de \(\chi\) para diferentes tipos de perturbaciones se recogen en la Tabla 1, donde se comparan con los valores correspondientes de \(r^2\) obtenidos para el conjunto de datos completo con la resolución \(32\). multiplicado por 32\multiplicado por 32\).

En primer lugar, se han realizado simulaciones partiendo de la misma configuración policristalina inicial pero con diferentes semillas aleatorias que inicializan las velocidades de las partículas al inicio de la fase de equilibrio (\(\varvec{\alpha }=(0,0)\)). Se utilizaron 15 configuraciones diferentes, para cada una de las cuales se han realizado 50 simulaciones con diferentes semillas aleatorias. Las curvas tensión-deformación para varias semillas aleatorias para una de las configuraciones se muestran en la Fig. 20a. Como se puede observar allí, las curvas son similares en el régimen elástico, dando como resultado valores similares del módulo de corte, sin embargo, en el régimen plástico existe una gran variabilidad de la tensión. En la Fig. 21 se muestra la sensibilidad \(\chi _{seed}=\chi (0,0)\) de la tensión en el valor de deformación dado a la elección inicial de las velocidades del átomo. Se puede observar que su valor es relativamente alto para valores de deformación muy bajos, lo que probablemente se debe a que las fluctuaciones térmicas de la tensión al inicio de la deformación son mayores que su valor promedio. Alrededor del valor de deformación de 0,02 \(\chi _{seed}\) cae a un valor muy bajo y permanece allí hasta que se produce el rendimiento, es decir, alrededor de 0,08 de deformación. Por encima de eso, \(\chi _{seed}\) alcanza valores ligeramente superiores a 0,2. Este resultado se puede utilizar para explicar la diferencia en los valores de \(r^2\) para la tensión en el valor de deformación fijo. Para el valor de deformación de 0,075 \(r^2\) es significativamente mayor que para 0,1, y también se produce un aumento en \(\chi _{seed}\) entre esos dos valores.

Para el módulo de corte, la deformación elástica y las otras definiciones del límite elástico se puede realizar el mismo análisis de forma análoga, es decir, determinando la varianza del valor elegido para las semillas aleatorias, dividiéndola por la varianza del mismo valor. para el conjunto original y promediando las 15 configuraciones, para las cuales se ha realizado el análisis de sensibilidad. Todos se muestran en la Tabla 1. El \(\chi _{seed}\) más bajo se encuentra para el módulo de corte. También está de acuerdo con el hecho de que \(r^2\) para el módulo de corte es el más alto para todas las cantidades estudiadas, acercándose al valor de 0,9 para el conjunto de datos completo y la resolución más alta. Por otro lado, la \(\chi _{seed}\) más alta la exhibe la tensión con una deformación de 0,1, que también tiene la \(r^2\) más baja. \(\chi _{seed}\) para el valor máximo de la tensión es mayor que para el valor de deformación fijo de 0,075 pero menor que para el valor de deformación de 0,1. Finalmente, los valores de \(\chi _{seed}\) para el límite elástico determinado con el método de compensación son relativamente bajos, lo que concuerda con sus altos valores de \(r^2\).

Dispersión de curvas tensión-deformación para diferentes magnitudes de la perturbación \(\varvec{\alpha }\). El recuadro muestra la desviación estándar promediada entre todas las configuraciones disponibles y la ventana del ancho 0,02 centrada en la deformación dada.

Curvas de tensión-deformación generadas para un ejemplo individual de microestructura policristalina inicial que se perturba de diferentes maneras, para evaluar la sensibilidad de la respuesta a pequeñas perturbaciones del estado inicial. (a) Perturbaciones en forma de diferentes semillas aleatorias utilizadas para inicializar las velocidades de los átomos, (b) perturbaciones de los nodos de Voronoi con \(\varvec{\alpha }=(3\)Å, 0), y (c) perturbaciones de la orientación angular de los granos con \(\varvec{\alpha }=(0,3^{\circ })\). Las líneas negras gruesas son los promedios de 50 curvas de tensión-deformación, cada una obtenida para una perturbación diferente del estado inicial. Las áreas grises representan la desviación estándar de la tensión en una deformación determinada.

\(\chi\) del valor de tensión en la deformación dada medida para la elección de la semilla aleatoria que inicializa las velocidades de los átomos, perturbación de la posición de los nodos en la teselación de Voronoi, perturbación de la rotación reticular de los granos, y todas esas perturbaciones combinadas.

Para estudiar la sensibilidad del sistema a las posiciones de los nodos en la teselación de Voronoi, para cada una de las 15 configuraciones elegidas se generaron 49 configuraciones adicionales desplazando los nodos aleatoriamente según una distribución gaussiana con una desviación estándar igual a 3 Å. que corresponde a \(\varvec{\alpha }=(3\)Å, 0). Este procedimiento conduce a configuraciones similares a las originales con estructuras de grano ligeramente diferentes pero la misma orientación reticular dentro de los granos. Las curvas tensión-deformación resultantes se muestran en la Fig. 20b. \(\chi (3\)Å, 0) para el valor de tensión en una deformación dada, determinado de manera análoga al caso de diferentes semillas aleatorias, se muestra en la Fig. 21. Allí se puede ver que \(\ chi (3\)Å, 0) es significativamente mayor que \(\chi _{seed}\). En particular, su magnitud para los valores de deformación de 0,075 y 0,1, utilizados para la predicción de la tensión, también es mayor en este caso.

De manera análoga a como en el caso de diferentes semillas aleatorias, se determinó \(\chi (3\)Å, 0) para otras cantidades del sistema. Se puede ver en la Tabla 1 que los valores de \(\chi (3\)Å, 0) son generalmente más altos que los valores correspondientes de \(\chi _{seed}\). Sin embargo, las relaciones entre sus valores para diferentes cantidades son similares. El \(\chi (3\)Å, 0) mínimo y máximo se muestra nuevamente mediante el módulo de corte y la tensión con una deformación de 0,1, respectivamente.

A continuación, se estudió la sensibilidad del sistema a la orientación reticular inicial de los granos dentro del policristal. Esta vez se generaron nuevas configuraciones con la posición fija de los nodos en la teselación de Voronoi y los ángulos de Euler perturbados según una distribución gaussiana con la desviación estándar igual a 3\(^{\circ }\), es decir \(\varvec{ \alpha }=(0,3^{\circ })\). Las curvas tensión-deformación correspondientes a esa perturbación se muestran en la Fig. 20c. Nuevamente, la magnitud de \(\chi (0,3^{\circ })\) en diferentes valores de deformación se muestra en la Fig. 21. Parece mayor en el régimen elástico en comparación con las medidas anteriores de \(\chi\ ). Además, como se muestra en la Tabla 1, \(\chi (0,3^{\circ })\) para el módulo de corte también es mayor en este caso, lo que está relacionado con la observación mencionada anteriormente de que las propiedades elásticas de la muestra están controlados principalmente por la orientación de la red, que es la propiedad perturbada aquí. Por otro lado, \(\chi (0,3^{\circ })\) en la parte plástica de la curva tensión-deformación es comparable a \(\chi (3\)Å, 0) y para algunos de los cantidades, en realidad es ligeramente menor. A diferencia de las medidas anteriores de \(\chi\), \(\chi (0,3^{\circ })\) para el límite elástico determinado con el método de compensación es menor para el offset mayor que para el menor. Nuevamente, esto está relacionado con el hecho de que la orientación reticular de los granos tiene un mayor impacto en las propiedades elásticas de la muestra que en las plásticas.

Todas las contribuciones a la sensibilidad discutidas anteriormente (semilla aleatoria, posición de los nodos y orientación de la red) contribuyen a la sensibilidad total del sistema a las condiciones iniciales. Sin embargo, no se puede esperar que la medida de la sensibilidad total \(\chi _{total}=\chi (3\)Å\(,3^{\circ })\) sea simplemente una suma de todas esas contribuciones. Por lo tanto, se llevaron a cabo simulaciones MD adicionales. Se realizaron de forma análoga a la anterior, pero en lugar de cambiar sólo uno de los parámetros iniciales comentados anteriormente, se variaron los tres simultáneamente. El valor de \(\chi (3\)Å\(,3^{\circ })\) como función de la deformación también se muestra en la Fig. 21. Se puede ver que siempre es mayor que \(\ chi\) medido con respecto al cambio de cualquiera de las características por separado.

Se determinaron los valores de \(\chi (3\)Å\(,3^{\circ })\) para todas las cantidades estudiadas y los resultados se recogen nuevamente en la Tabla 1. Se pueden comparar con los valores correspondientes de asintóticos. previsibilidad \(r_{asymptotic}^2\) determinada como la intersección en las gráficas 1/N para la resolución de los descriptores \(32\times 32\times 32\) y se puede observar que las cantidades que son más sensibles a las condiciones iniciales del sistema (\(\chi (3\)Å\(,3^{\circ })\) más grande) tienden a tener \(r^2\) más pequeño. Los valores de \(r_{asymptotic}^2\) se trazan frente a los de \(\chi (3\)Å\(,3^{\circ })\) en la Fig. 22, donde se observa una correlación lineal entre ellos. se puede observar. Además, en el gráfico se muestra el valor máximo de previsibilidad en el \(r_{asintótico}^2\) dado igual a \(1-\chi (3\)Å\(,3^{\circ })\) como la línea azul. Para todas las cantidades, la \(r_{asymptotic}^2\) real se encuentra debajo de esa línea, lo que significa que la condición \(r_{asymptotic}^2 \le 1-\chi (3\)Å\(,3^) {\circ })\) siempre está satisfecho.

Ya se han mencionado algunos posibles factores adicionales además de \(\chi\) que pueden limitar la previsibilidad, sin embargo, también se puede observar que la diferencia entre el máximo (\(1-\chi (3\)Å\(,3 ^{\circ })\)) y la previsibilidad real (\(r^2\)) difiere entre las cantidades. Es el más bajo para el módulo de corte y el más alto para la tensión con una deformación de 0,1. Esas dos cantidades exhiben también la \(r^2\) más alta y la más baja, respectivamente. Por lo tanto, parece que esos otros factores que limitan la previsibilidad tienen contribuciones diferentes para diferentes cantidades. Generalmente, se puede esperar que las propiedades elásticas, como el módulo de corte, sean relativamente fáciles de predecir porque su medición requiere sólo una pequeña deformación de la muestra, lo que corresponde a una evolución temporal corta del sistema. Además, se ha demostrado que el valor del módulo de corte está determinado principalmente por la orientación reticular de los granos individuales. Por tanto, se puede esperar que la relación entre los descriptores y el valor predicho sea relativamente simple. Por otro lado, las propiedades plásticas de la muestra, como el valor de la tensión en la deformación de 0,1, pueden ser más difíciles de predecir porque ocurren más adelante en la curva tensión-deformación, de modo que el sistema podría haber perdido parcialmente su memoria de su estado inicial.

Valores de \(r_{asintótico}^2\) de diferentes cantidades estudiadas en este trabajo con la resolución de \(32\times 32\times 32\) graficados contra su sensibilidad total \(\chi (3\)Å\( ,3^{\circ })\) a las condiciones iniciales de la muestra. La línea verde es un ajuste lineal de los datos y la línea azul representa el máximo \(r_{asymptotic}^2\) posible para el \(\chi (3\)Å\(,3^{\circ }) dado. \), es decir, \(1-\chi (3\)Å\(,3^{\circ })\).

En este trabajo, la previsibilidad (medida como el coeficiente de determinación \(r^2\)) de las propiedades elásticas y plásticas de policristales de hierro de tamaño nanométrico deformados por cizallamiento se ha determinado utilizando métodos ML. Si bien el módulo de corte se puede definir fácilmente como la pendiente de la curva tensión-deformación para deformaciones pequeñas, definir el límite elástico no es tan sencillo y, por lo tanto, se han considerado varias definiciones. Para todas las cantidades estudiadas, se encontró que la previsibilidad aumenta con el tamaño del conjunto de datos N y la resolución espacial de los descriptores microestructurales elegidos. Sin embargo, siempre parece alcanzar un cierto valor por debajo de 1, lo que implica que existe un cierto límite fundamental de previsibilidad de la deformación de los policristales pequeños. Además, se encontró que la previsibilidad obtenida por la CNN era mayor para el módulo de corte que para el límite elástico, independientemente de la definición exacta de este último. Las razones de esa diferencia y del límite de previsibilidad se han explorado midiendo la sensibilidad del sistema estudiado a pequeñas perturbaciones de su estado inicial.

Esta sensibilidad del sistema se ha medido variando la semilla aleatoria que inicializa las velocidades en la simulación MD, la posición de los nodos en la teselación de Voronoi y las orientaciones reticulares de los granos dentro de la configuración policristalina inicial. Se ha demostrado que, en función de las diferencias en la previsibilidad, las propiedades plásticas del sistema presentan una mayor sensibilidad al estado inicial que las propiedades elásticas. En general, se puede considerar la sensibilidad como una medida de la cantidad de información que no está disponible para el algoritmo ML. Dado que a cualquier temperatura finita el sistema fluctúa constantemente y sus descriptores se extraen de la configuración equilibrada en algún paso de tiempo, la CNN desconoce la magnitud de las fluctuaciones de la posición de los átomos y sus velocidades. Además, una representación voxelizada de la microestructura inicial con cualquier resolución finita tiende a ocultar pequeñas diferencias en la microestructura inicial entre muestras. Por lo tanto, dado que el sistema muestra sensibilidad a pequeñas perturbaciones de la microestructura inicial, dos configuraciones con descriptores idénticos pueden dar como resultado una evolución temporal diferente y, como se estudia aquí, diferentes curvas de tensión-deformación.

Por lo tanto, nuestro estudio proporciona información importante sobre los límites fundamentales de la previsibilidad de la deformación, y se espera que esa información se aplique de manera más general a la predicción de la evolución temporal de sistemas físicos complejos. Incluso si la dinámica de un sistema complejo, como la deformación de los policristales estudiados aquí, se rige por ecuaciones de movimiento deterministas, su previsibilidad aún puede ser limitada debido a la información incompleta sobre el estado inicial y otros factores como las fluctuaciones térmicas aleatorias. Aunque el estudio aquí presentado es puramente computacional, las conclusiones que se extraen del mismo también podrían extenderse a la experimentación. La precisión con la que se puede determinar mediante mediciones la estructura de la muestra es siempre finita y, debido a las constantes fluctuaciones térmicas, prácticamente no se dispone de información sobre las velocidades de las partículas individuales. En general, el análisis presentado aquí sobre el papel de la sensibilidad del sistema a pequeñas perturbaciones de su configuración inicial para limitar la previsibilidad de la evolución futura del sistema podría aplicarse en una amplia gama de contextos donde se pretende predecir el comportamiento de un sistema complejo. .

Las herramientas utilizadas para la generación de muestras policristalinas son Atomsk47 y Nanocrystal Generator48; este último programa ha sido desarrollado en nuestro grupo de investigación. Ambos programas implementan la teselación de Voronoi49,50, que es un método para dividir el espacio tridimensional en un conjunto de poliedros, que aquí se consideran los granos individuales del policristal. La teselación de Voronoi es una forma común de generar policristales, que existe en muchas variantes51. Se define completamente especificando las posiciones de un cierto número de puntos, llamados semillas, en el espacio. Para cada una de esas semillas hay una región correspondiente llamada celda de Voronoi que contiene todos los puntos que están más cerca de esa semilla dada que de cualquier otra semilla. Posteriormente, esas células de Voronoi se llenan con átomos dispuestos en la estructura reticular elegida y con la orientación cristalográfica especificada para representar los granos del policristal. En las tres direcciones se implementan condiciones de contorno periódicas.

En este trabajo tanto las posiciones de las semillas como los ángulos de Euler para la orientación cristalográfica de los granos individuales se eligen aleatoriamente para cada policristal. Sin embargo, la distribución uniforme de los ángulos de Euler da como resultado una distribución no uniforme de las orientaciones de los cristales. Por lo tanto, las muestras policristalinas estudiadas en este trabajo son en realidad policristales texturizados con la rotación de los granos sesgada hacia los polos a lo largo de la dirección z52.

Algunos conjuntos de parámetros en la teselación de Voronoi dieron como resultado configuraciones que no eran estables debido a que las distancias entre los átomos a través del límite del grano eran demasiado pequeñas. Estas configuraciones se eliminaron y se reemplazaron por otras nuevas que no provocaron este problema.

Como potencial interatómico para las simulaciones MD se utiliza el potencial del modelo atómico integrado (EAM) para Fe53. Durante una sola ejecución MD, primero se minimiza la energía potencial de la configuración dejando que los átomos se relajen y luego el sistema se equilibra a una temperatura constante de 300 K usando el termostato Nose-Hoover y presión cero en el conjunto NPT. Finalmente, la deformación por corte de la muestra se realiza en el conjunto NPH en el plano xy bajo una velocidad de deformación constante, lo que se realiza inclinando la caja de simulación. Debido a la elección del conjunto se permite que la temperatura cambie, es decir, no se utiliza ningún termostato. Esto aseguraría que las ecuaciones de movimiento sean realmente deterministas, lo que sería análogo, por ejemplo, a las simulaciones de dinámica de dislocaciones discretas (DDD) donde no hay ruido térmico presente. Sin embargo, observe que la aleatoriedad se incluye a través de diferentes velocidades iniciales de los átomos elegidas al azar para cada muestra. Durante toda la deformación, la componente xy instantánea del tensor de presión se almacena en función del tiempo.

El paso de tiempo utilizado en todas las simulaciones MD es 1 fs. Después de la ejecución de equilibrio que dura 1 ns, la ejecución de deformación por corte MD se realiza a una velocidad de deformación constante de 3\(\cdot\)10\(^{8}\)/s hasta que la deformación alcanza el valor de 0,15. El componente xy del tensor de presión se almacena cada 50 pasos.

Se extraen dos campos tridimensionales diferentes de la configuración equilibrada de los policristales y luego se utilizan como descriptores de entrada para el algoritmo ML. Uno de ellos es la orientación local de la red dada por la representación cuaternión de las rotaciones en el espacio tridimensional. Un cuaternión consta de cuatro componentes y se puede escribir como \(\textbf{q}=\cos (\Theta /2)+\textbf{u}\sin (\Theta /2)\), donde \(\textbf{ u}=(u_x,u_y,u_z)\) es un vector unitario en el espacio tridimensional y \(\Theta\) es el ángulo de rotación alrededor de ese vector. Dado que este descriptor brinda información sobre la orientación cristalográfica local, también codifica los ángulos de desorientación entre los granos, que podrían ser relevantes para las cantidades predichas en el trabajo. El otro descriptor es la densidad local de átomos en el límite del grano, que se identifica eliminando todos los átomos que pertenecen a la estructura bcc de los granos. Otro descriptor que se probó fue la energía potencial local. Si bien se esperaba que pudiera contener información importante relacionada con ángulos de desorientación específicos de los límites de los granos, como es el caso en el modelo de red de sitios de coincidencia, se encontró que incluir ese descriptor adicional no mejora la puntuación de previsibilidad de ninguna manera.

Ambos descriptores utilizados en el trabajo, ilustrados para una configuración de ejemplo en la parte izquierda de la Fig. 2, son extraídos por el software OVITO54, que proporciona características capaces de identificar el tipo de estructura local (análisis de vecinos comunes55) y la orientación cristalográfica ( coincidencia de plantillas poliédricas56). Los descriptores se utilizan para predecir el módulo de corte y el límite elástico mediante una CNN.

Como se mostró anteriormente, al entrenar una CNN con cada uno de esos descriptores por separado, se encontró que para predecir el módulo de corte la orientación de los granos es más importante, mientras que para predecir el límite elástico el límite del grano es un descriptor más útil. Sin embargo, la previsibilidad es siempre máxima cuando se utilizan ambos descriptores. Por lo tanto, los descriptores se combinan en cinco conjuntos diferentes (cuatro para la orientación de la red y uno para el límite de grano).

Una CNN es un algoritmo ML que toma como entrada una imagen pixelizada del sistema y la procesa a través de un conjunto de filtros en capas convolucionales y de agrupación. Dado que el sistema estudiado aquí es tridimensional, las matrices de entrada constan de vóxeles, que son equivalentes a píxeles en tres dimensiones. En este trabajo se entrena una CNN para predecir los rasgos característicos de las curvas tensión-deformación mencionadas anteriormente: módulo de corte y límite elástico según sus diversas definiciones.

Las matrices de entrada se preparan en varias resoluciones diferentes, que representan la precisión con la que se muestrea el campo extraído de la configuración dada. El más alto es \(64\times 64\times 64\) porque para esa resolución el número de vóxeles es del mismo orden de magnitud que el número de átomos. Las resoluciones más bajas utilizadas son \(16\times 16\times 16\) y \(32\times 32\times 32\). La matriz para la orientación de la red local se creó escaneando todos los átomos del sistema y asignando sus valores de cuaternión al elemento de la matriz cuyo centro de la celda correspondiente está más cerca del átomo dado. Si más tarde se encontraba otro átomo aún más cerca del centro de esa celda, el valor del cuaternión asignado a esa celda era reemplazado por el nuevo. Por otro lado, la matriz para la densidad local de átomos en el límite del grano se preparó asignando el número de átomos identificados como pertenecientes al límite dentro de la celda dada al elemento correspondiente de la matriz.

Los datos de las matrices de entrada se pasan y posteriormente se procesan mediante las capas convolucionales, de relleno periódico y de agrupación incluidas en la arquitectura de la CNN. Las capas convolucionales contienen 8 filtros. El tamaño del núcleo es \(3\times 3\times 3\) y la longitud de la zancada es 1 en cada dirección. La función de la capa de relleno periódica es mantener el tamaño de la matriz igual que antes de la capa convolucional extendiéndola periódicamente en 1 en cada uno de los bordes. Las capas de agrupación máxima reducen cada una de las dimensiones espaciales de los datos a la mitad. Se hace dividiendo la entrada en cubos de dimensiones \(2\times 2\times 2\) y seleccionando el valor máximo de cada uno de ellos. Una secuencia de una capa convolucional y de agrupación se repite tantas veces como sea necesario para reducir el tamaño de la matriz a la dimensión \(1\times 1\times 1\times 8\). Por lo tanto, el número total de esas capas depende de la resolución de entrada. La función de activación en la primera capa convolucional es sigmoidea, mientras que en todas las siguientes se utilizan funciones rectificadoras. Se encontró que esta elección de funciones de activación aumenta el rendimiento del entrenamiento. Además, en paralelo al canal principal se agrega otro canal con menos capas convolucionales, de relleno periódico y de agrupación, pero con filtros más grandes en estas últimas, lo que conduce a una reducción más rápida del tamaño de las matrices. La salida de ambos canales finalmente se aplana y se concatena dando una matriz lineal de tamaño 16, que se procesa aún más mediante una capa completamente conectada que proporciona un número único que representa el módulo de corte o el límite elástico como salida.

Para el entrenamiento de la CNN se utiliza el optimizador Adam con la tasa de aprendizaje \(5\cdot 10^{-5}\). La regularización L2 se aplica a todas las capas convolucionales con el parámetro \(\lambda =0.001\).

Para probar la convergencia del entrenamiento de CNN, el procedimiento se realiza para diferentes tamaños del conjunto de datos, comenzando con 500 o 1000 configuraciones y aumentándolo sucesivamente en un número determinado hasta cubrir el conjunto de datos completo. Para cada una de las cantidades estudiadas, se entrenan cinco CNN diferentes para diferentes semillas aleatorias que representan diferentes divisiones del conjunto de datos en el conjunto de entrenamiento, prueba y validación en una proporción de 80:10:10%. El propósito del conjunto de validación es interrumpir el entrenamiento en la época en la que el valor correspondiente de la función de pérdida para ese conjunto alcanza su valor mínimo. En este trabajo se utilizó el criterio de parada temprana, con la paciencia de 500 épocas, luego de las cuales se interrumpe el entrenamiento si no ha habido disminución en la función de pérdida del conjunto de validación. Los parámetros finales de la CNN se eligen a partir de aquella época en la que la función de pérdida del conjunto de validación tiene el valor mínimo.

Todos los datos incluidos en este trabajo están disponibles del autor correspondiente (MM) previa solicitud.

Kheradmand, N., Barnoush, A. y Vehoff, H. Investigación del papel de los límites de grano en las propiedades mecánicas de los metales, en Journal of Physics: Conference Series, vol. 240 (Publicación IOP, 2010) pág. 012017.

Uchic, MD, Shade, PA y Dimiduk, DM Plasticidad de monocristales de escala micrométrica en compresión. Año. Rev. Mater. Res. 39, 361 (2009).

Artículo ADS CAS Google Scholar

Dimiduk, D., Uchic, M. & Parthasarathy, T. Comportamiento de deslizamiento único afectado por el tamaño de microcristales de níquel puro. Acta Mater. 53, 4065 (2005).

Artículo ADS CAS Google Scholar

Janiesch, C., Zschech, P. y Heinrich, K. Aprendizaje automático y aprendizaje profundo. Electrón. Marca. 31, 685 (2021).

Artículo de Google Scholar

Carleo, G. et al. Aprendizaje automático y ciencias físicas. J.Rev.Mod. Física. 91, 045002 (2019).

Artículo ADS CAS Google Scholar

Shinde, PP y Shah S. Una revisión de las aplicaciones de aprendizaje automático y aprendizaje profundo, en la Cuarta Conferencia Internacional sobre Automatización y Control de Comunicaciones Informáticas (ICCUBEA) de 2018 (IEEE, 2018), págs.

Ongsulee, P. Inteligencia artificial, aprendizaje automático y aprendizaje profundo, en 2017, 15.ª Conferencia Internacional sobre TIC e Ingeniería del Conocimiento (ICT &KE) (IEEE, 2017) págs.

Schmidt, J., Marques, MR, Botti, S. y Marques, MA Avances recientes y aplicaciones del aprendizaje automático en la ciencia de materiales de estado sólido. npj Computación. Madre. 5, 83 (2019).

ADS del artículo Google Scholar

Rajendra, P., Girisha, A. y Naidu, TG Avance del aprendizaje automático en la ciencia de materiales. Madre. Hoy: Proc. 62, 5503–5507 (2022).

Stoll, A. & Benner, P. Aprendizaje automático para la caracterización de materiales con una aplicación para predecir propiedades mecánicas. GAMM-Mitteilungen 44, e202100003 (2021).

Artículo MathSciNet Google Scholar

Chan, H., Cherukara, M., Loeffler, TD, Narayanan, B. y Sankaranarayanan, SK El aprendizaje automático permitió la caracterización microestructural autónoma en muestras 3D. npj Computación. Madre. 6, 1 (2020).

ADS del artículo Google Scholar

Baskaran, A., Kane, G., Biggs, K., Hull, R. y Lewis, D. Caracterización adaptativa de un conjunto de datos de microestructura utilizando un enfoque de aprendizaje automático de dos etapas. Computadora. Madre. Ciencia. 177, 109593 (2020).

Artículo CAS Google Scholar

Vasudevan, R., Pilania, G. y Balachandran, PV Aprendizaje automático para el diseño y descubrimiento de materiales. J. Aplica. Física. 129, 070401 (2021).

Artículo ADS CAS Google Scholar

Durodola, J. Aprendizaje automático para diseño, transformación de fases y propiedades mecánicas de aleaciones. Prog. Materia de ciencia. 123, 100797 (2022).

Artículo CAS Google Scholar

Moosavi, SM, Jablonka, KM & Smit, B. El papel del aprendizaje automático en la comprensión y el diseño de materiales. Mermelada. Química. Soc. 142, 20273 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Wei, J. y col. Aprendizaje automático en ciencia de materiales. InfoMat 1, 338 (2019).

Artículo CAS Google Scholar

Dai, D. y col. Método de construcción de relaciones estructura-propiedad a partir de datos mediante minería asistida por aprendizaje automático para aplicaciones de diseño de materiales. Madre. Diseño 196, 109194 (2020).

Artículo CAS Google Scholar

Fu, Z., Liu, W., Huang, C. y Mei, T. Una revisión de la predicción del rendimiento basada en el aprendizaje automático en la ciencia de materiales. Nanomateriales 12, 2957 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Chibani, S. y Coudert, F.-X. Enfoques de aprendizaje automático para la predicción de propiedades de materiales. Mater APL. 8, 080701 (2020).

Artículo ADS CAS Google Scholar

Jung, J., Yoon, JI, Park, HK, Kim, JY y Kim, HS Un enfoque eficiente de aprendizaje automático para establecer vínculos estructura-propiedad. Computadora. Madre. Ciencia. 156, 17 (2019).

Artículo de Google Scholar

Salmenjoki, H., Alava, MJ & Laurson, L. Aprendizaje automático de la deformación plástica de cristales. Nat. Comunitario. 9, 5307 (2018).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Sarvilahti, M., Skaugen, A. y Laurson, L. Aprendizaje automático que determina los choques de dislocaciones. Mater APL. 8, 101109 (2020).

Artículo ADS CAS Google Scholar

Mińkowski, M., Kurunczi-Papp, D. & Laurson, L. El aprendizaje automático revela la previsibilidad dependiente de la tasa de deformación de la plasticidad de dislocaciones discretas. Física. Rev. Mater. 6, 023602 (2022).

Artículo de Google Scholar

Ovaska, M., Laurson, L. & Alava, MJ Dinámica de fijación y dislocación colectiva. Ciencia. Reps. Rev. 5, 10580 (2015).

Artículo ADS PubMed PubMed Central Google Scholar

Papanikolaou, S., Song, H. & Van der Giessen, E. Obstáculos y fuentes en la dinámica de dislocaciones: fortalecimiento y estadísticas de eventos plásticos abruptos en la compresión de nanopilares. J. Mech. Física. Sólidos 102, 17 (2017).

ADS del artículo Google Scholar

Zapperi, S. & Zaiser, M. Depinning de una dislocación: la influencia de las interacciones de largo alcance. Madre. Ciencia. Ing., A 309, 348 (2001).

Artículo de Google Scholar

Chan, PY, Tsekenis, G., Dantzig, J., Dahmen, KA y Goldenfeld, N. Plasticidad y dinámica de dislocaciones en un modelo cristalino de campo de fase. Física. Rev. Lett. 105, 015502 (2010).

Artículo ADS PubMed Google Scholar

Alava, MJ, Laurson, L. & Zapperi, S. Ruido crepitante en la plasticidad. EUR. Física. J. especificaciones. Arriba. 223, 2353 (2014).

Artículo de Google Scholar

Shu, C., He, J., Xue, G. y Xie, C. Aprendizaje de representación de gráficos de conocimiento de granos: un nuevo paradigma para la predicción de propiedades de microestructura. Cristales 12, 280 (2022).

Artículo CAS Google Scholar

Vieira, R. & Lambros, J. Predicciones de redes neuronales de aprendizaje automático para la acumulación de deformaciones en los límites de grano en un metal policristalino. Exp. Mec. 61, 627 (2021).

Artículo CAS Google Scholar

Hestroffer, JM, Charpagne, M.-A., Latypov, MI y Beyerlein, IJ Graficar redes neuronales para el aprendizaje eficiente de las propiedades mecánicas de los policristales. Computadora. Madre. Ciencia. 217, 111894 (2023).

Artículo CAS Google Scholar

Dai, M., Demirel, MF, Liang, Y. y Hu, J.-M. Grafique redes neuronales para obtener una predicción precisa e interpretable de las propiedades de los materiales policristalinos. npj Computación. Madre. 7, 103 (2021).

Artículo ADS CAS Google Scholar

Karimi, K. y col. Predicción de la nanodureza del acero mediante el uso de redes neuronales gráficas en mapas de policristalinidad de superficie. Scripta Materialia 234, 115559 (2023).

Artículo CAS Google Scholar

Thompson, AP y cols. LAMMPS: una herramienta de simulación flexible para el modelado de materiales basados ​​en partículas a escala atómica, meso y continua. comp. Física. Com. 271, 108171 (2022).

Artículo CAS MATH Google Scholar

Chicco, D., Warrens, MJ y Jurman, G. El coeficiente de determinación r-cuadrado es más informativo que smape, mae, mape, mse y rmse en la evaluación del análisis de regresión. Computación entre pares. Ciencia. 7, e623 (2021).

Artículo PubMed PubMed Central Google Scholar

Sheng, G. y col. Propiedades elásticas efectivas de policristales basadas en la descripción del campo de fase. Madre. Ciencia. Ing., A 554, 67 (2012).

Artículo CAS Google Scholar

Weissmüller, J., Markmann, J., Grewer, M. & Birringer, R. Cinemática de la deformación de policristales por deslizamiento de los límites de grano. Acta Mater. 59, 4366 (2011).

ADS del artículo Google Scholar

Patriarca, L., Abuzaid, W., Sehitoglu, H. & Maier, HJ Transmisión de deslizamiento en policristal bcc FeCr. Madre. Ciencia. Ing., A 588, 308 (2013).

Artículo CAS Google Scholar

Wei, X., Lee, D., Shim, S., Chen, X. y Kysar, JW Prueba de abultamiento de deformación plana para películas delgadas de cobre nanocristalino. Escritura Mater. 57, 541 (2007).

Artículo CAS Google Scholar

Ross, C. Mecánica de sólidos, serie de ciencias de ingeniería de Horwood (Elsevier Science, 1999).

Brandstetter, S. y col. De la microplasticidad a la macroplasticidad. Adv. Madre. 18, 1545 (2006).

Artículo CAS Google Scholar

Saada, G. Hall-Petch revisado. Madre. Ciencia. Ing., A 400, 146 (2005).

Artículo de Google Scholar

Dinkgreve, M., Paredes, J., Denn, MM & Bonn, D. Sobre diferentes formas de medir “el” límite elástico. J. Nonnewton. Mecánica de fluidos. 238, 233 (2016).

Artículo CAS Google Scholar

Møller, PC, Mewis, J. & Bonn, D. Límite elástico y tixotropía: sobre la dificultad de medir los límites elásticos en la práctica. Materia blanda 2, 274 (2006).

Artículo ADS PubMed Google Scholar

Ishikawa, K., Watanabe, H. y Mukai, T. Comportamiento de deformación a alta velocidad de deformación de una aleación de magnesio AZ91 a temperaturas elevadas. Madre. Letón. 59, 1511 (2005).

Artículo CAS Google Scholar

Luo, J., Wang, L., Liu, S. y Li, M. La correlación entre el comportamiento del flujo y la evolución de la microestructura durante el trabajo en caliente de la aleación TC18. Madre. Ciencia. Ing.: A 654, 213 (2016).

Artículo CAS Google Scholar

Hirel, P. Atomsk: una herramienta para manipular y convertir archivos de datos atómicos. Computadora. Física. Comunitario. 197, 212 (2015).

Artículo ADS CAS Google Scholar

Voimanen, E. Generador de nanocristales, https://gitlab.com/EricssonWilli/nanocrystal-generator

Brostow, W., Dussault, J.-P. & Fox, BL Construcción de poliedros de Voronoi. J. Computación. Física. 29, 81 (1978).

Artículo ADS MathSciNet CAS MATH Google Scholar

Finney, JL Un procedimiento para la construcción de poliedros de Voronoi. J. Computación. Física. 32, 137 (1979).

Artículo ADS MATEMÁTICAS Google Scholar

Falco, S., Jiang, J., De Cola, F. & Petrinic, N. Generación de microestructuras policristalinas tridimensionales con una técnica de teselación condicionada de laguerre-voronoi. Computadora. Madre. Ciencia. 136, 20 (2017).

Artículo CAS Google Scholar

Perez-Sala, X., Igual, L., Escalera, S. & Angulo, C. Muestreo uniforme de rotaciones para aprendizaje discreto y continuo de modelos de formas 2D, en Visión robótica: tecnologías para aplicaciones de visión y aprendizaje automático (IGI Global, 2013) págs. 23–42.

Mendelev, M. et al. Desarrollo de nuevos potenciales interatómicos apropiados para hierro cristalino y líquido. Fil. revista 83, 3977 (2003).

Artículo ADS CAS Google Scholar

Stukowski, A. Visualización y análisis de datos de simulación atomística con OVITO, la herramienta de visualización abierta. Modelo. Simultáneo. Madre. Ciencia. Ing. 18, 015012 (2009).

ADS del artículo Google Scholar

Honeycutt, JD & Andersen, HC Estudio de dinámica molecular de fusión y congelación de pequeños grupos de Lennard-Jones. J. Física. Química. 91, 4950 (1987).

Artículo CAS Google Scholar

Larsen, PM, Schmidt, S. y Schiøtz, J. Identificación estructural robusta mediante coincidencia de plantillas poliédricas. Modelo. Simultáneo. Madre. Ciencia. Ing. 24, 055007 (2016).

ADS del artículo Google Scholar

Descargar referencias

Los autores agradecen el apoyo de la Academia de Finlandia a través del Proyecto Academia COPLAST (proyecto no. 322405). Los autores desean agradecer a Henri Salmenjoki por los interesantes debates sobre el aprendizaje automático.

Laboratorio de Física Computacional, Universidad de Tampere, PO Box 692, FI-33014, Tampere, Finlandia

Marcin Mińkowski y Lasse Laurson

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

MM generó la base de datos de entrenamiento, realizó simulaciones de dinámica molecular, entrenó los algoritmos de aprendizaje automático y escribió la versión inicial del manuscrito. LL diseñó y supervisó el proyecto. Ambos autores contribuyeron a la redacción del manuscrito.

Correspondencia a Marcin Mińkowski.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado al autor(es) original(es) y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Mińkowski, M., Laurson, L. Predicción de las propiedades elásticas y plásticas de pequeños policristales de hierro mediante aprendizaje automático. Informe científico 13, 13977 (2023). https://doi.org/10.1038/s41598-023-40974-0

Descargar cita

Recibido: 29 de mayo de 2023

Aceptado: 19 de agosto de 2023

Publicado: 26 de agosto de 2023

DOI: https://doi.org/10.1038/s41598-023-40974-0

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.

COMPARTIR