Durante 5 años ayudamos a las empresas a alcanzar sus objetivos de mercado y de marca. Millennial es una empresa especializada en tecnología.

Galleria

Contactos

Enrique Palacios 360, Oficina 313, Miraflores - Lima

+51-975-113-510

«El Gobierno de Australia del Sur organizó un concurso de aprendizaje automático, «ExploreSA: The Gawler Challenge», donde los concursantes desarrollaron una serie de modelos para la exploración de minerales.».

 

Mapa de escala de color de los Estados Unidos que muestra datos radiométricos.
Datos geofísicos (radiométricos) para los Estados Unidos | Argumento por autor

ExploreSA: El desafío de Gawler

Tras el éxito del ExploreSA: The Gawler Challenge, el Gobierno de Australia meridional ha asignado…

www.energymining.sa.gov.au

 

Los datos

  • Minas actuales e históricas en los Estados Unidos: ubicaciones, años extraídos y minerales económicamente viables para casi 140 mil minas.
  • Mapas de anomalías gravitacionales que muestran la diferencia entre la aceleración esperada y observada debido a la gravedad. La anomalía gravitacional de Bouguer tiene correcciones para la atracción gravitacional de la roca sobre el nivel del mar, así como la variabilidad del terreno. La anomalía gravitacional isostática tiene una corrección para el material subsuperficial de menor densidad.
  • Los mapas de anomalías magnéticas muestran la diferencia entre el campo magnético medido y esperado debido a las propiedades magnéticas o geoquímicas locales.
  • Mapas geológicos estatales que muestran las ubicaciones de las fallas que indican discontinuidades en la roca que indican una separación o movimiento.
  • Mapas de radiación superficial que indican la distribución estimada de los elementos radiactivos en la corteza. Los mapas están disponibles para potasiouraniotorio y dosis absorbida.
  • Datos geoquímicos que muestran concentraciones elementales inorgánicas de muestras de rocassedimentos y suelos por ubicación.
  • Mapas de dominio de sótano que indican las 77 subregiones únicas del continente norteamericano.
  • Mapas de unidades K-B que indican las 164 subregiones únicas del continente norteamericano publicados por King y Beikman (1974a).

Model Building

Pairs plot for eight features with separate series for the positive and negative class.
Training Data Pairs Plot Showing Positive (red) and Negative (blue) Classes | Plot by Author
Boxplot showing cross validated precision vs. the number of trees in the random forest.
10-Fold Cross Validation Results | Plot by Author

Model Interpretation

Gráfico de columna que muestra la importancia de la característica según lo determinado por la disminución media de la impureza.
Importancia de las características en el | de modelos de bosque aleatorio Argumento por autor
Cuadrícula de parcela de dependencia parcial para ocho características sobre la probabilidad de depósitos de oro económicamente viables.
Gráficos de dependencia parcial para el clasificador de bosque aleatorio | Argumento por autor

Rendimiento del modelo

Matriz de confusión para el clasificador de bosque aleatorio en el conjunto de datos de prueba.
Confusion Matrix for Random Forest Classifier | Figure by Author
Precisión: curva de recuperación para el clasificador de bosque aleatorio en el conjunto de datos de prueba.
Curva de recuperación de precisión para clasificadores de bosque aleatorios | Argumento por autor
Tabla que muestra las principales minas de oro productoras según lo predicho por el clasificador aleatorio de bosques. La mina Vulture en AZ es la mina de producción más larga en el conjunto de pruebas predicho correctamente por el modelo.

Mirando hacia el futuro

  • Pruebe un modelo más sofisticado: hay muchos datos, por lo que podemos ver un mejor rendimiento en una clase de función más flexible, como máquinas de vectores de soporte o modelos de aprendizaje profundo.
  • Pruebe nuevas funciones: el rendimiento del modelo podría mejorar con nuevas funciones. Uno de los concursantes en el concurso ExploreSA utilizó la profundidad del sótano / roca madre como una característica en el modelo. Los datos de alteración hidrotermal también están disponibles y se asocian comúnmente con depósitos de oro y cobre.
  • Pruebe la ingeniería de características: los datos geoquímicos se dejaron fuera de este análisis, pero potencialmente podrían usarse para crear nuevas entidades mapeadas con otras técnicas de aprendizaje automático como la regresión de la cresta del núcleo o la regresión del proceso gaussiano. Los datos del dominio del sótano y de la unidad K-B también pueden tener potencial para transformarse en nuevas características de ingeniería.

Referencias

 

 
 
 
 
 
 
 

Ayudamos a las empresas a elevar su valor con el aporte de especialistas en Analítica, 
Diseño y Desarrollo de Soluciones, Control de Calidad y Consultoría Tecnologica.