UNA APROXIMACIÓN DE CLASIFICACIÓN DE ROSTROS USANDO ANTROPOMETRÍA FACIAL

 

AN APPROACH OF CLASSIFICATION OF FACES USING FACIAL ANTHROPOMETRY

 

 

Luis Enrique Colmenares-Guillén1, Maya Carrillo Ruiz1, Graciela Gaona Bernabé1,

José Luis Hernández Ameca1, Francisco Javier Albores Velasco2

1Facultad de Ciencias de la Computación, Benemérita Universidad Autónoma de Puebla, Puebla México

2Facultad de Ciencias Básicas, Ingeniería y Tecnología, Universidad Autónoma de Tlaxcala, Tlaxcala, México

E-mail: [lecolme, crrllrzmy, graziellats501, javier.albores]@gmail.com, amecajl@hotmail.com

 

 

(Enviado Noviembre 01, 2018; Aceptado Diciembre 24, 2018)  

 

 

 

Resumen

El procesamiento de imágenes de rostros es una de las áreas de estudio dentro del campo de visión por computadora. Existen trabajos principalmente en reconocimiento de rostros, identificación de emociones, entre otros, sin embargo el desarrollo de sistemas de estimación de edad de forma automática es un desafío que aún sigue en investigación. En el presente trabajo, se propone un procedimiento que clasifica a un rostro en un rango de edad determinado. Para dicha propuesta se analizan teorías de crecimiento craneofacial y antropometría facial, derivando en una selección de parámetros antropométricos que representan características discriminantes para la distinción de rostros a diferentes edades. Dichos parámetros se utilizaron para generar un modelo de clasificación en la plataforma Weka utilizando los algoritmos SVM, Knn, Naïve Bayes y C4.5. Se utilizó validación cruzada a 10 pliegues para los cuatro algoritmos. La mayor exactitud se obtuvo con el algoritmo Knn con 7 vecinos y fue de 75. 28%. Esto comprueba la utilidad de las distancias antropométricas seleccionadas para el reconocimiento de edad en imágenes de rostros.

 

Palabras clave:Estimación de Edad, Antropometría Facial, Crecimiento Craneofacial, Puntos Fiduciales.

 

Abstract

The face images processing is one of the study areas within the field of computer vision. Thus there are works mainly in face recognition, emotions identification, among others, however the development of automatic systems of age estimation is a challenge that is still under investigation. In the present work, a procedure to classify a face in a determined age range is proposed. For said proposal, theories of craniofacial growth and facial anthropometry are analyzed, deriving in a selection of anthropometric parameters that represent discriminant characteristics for the distinction of faces at different ages. These parameters were used to generate a classification model on Weka platform using the SVM, Knn, Naïve Bayes and C4.5 algorithms. Cross validation at 10 folds was used for each algorithm. The highest accuracy was obtained with Knn with 7 neighbors and it was 75. 28%. This verifying the usefulness of the anthropometric distances selected for the recognition of age in face images.

 

Keywords:Age Estimation, Facial Anthropometry, Craniofacial Growth, Fiducial Points.

 

 


1      INTRODUCCIÓN 

 

El objetivo de un sistema de estimación de edad es determinar la edad específica o el rango de edad de una persona, basándose solamente en la imagen digital del rostro.

 

Las personas tienen la habilidad de determinar edades con alta precisión, el cómo realizan este proceso ha sido estudiado desde diferentes áreas, entre ellas, desde el campo de la psicología [1], lo que conlleva a plantear métodos para la estimación de edad de forma automática.

 

La estimación de edad de forma automática tiene numerosas aplicaciones como el control de seguridad: como por ejemplo, las máquinas expendedoras de alcohol y cigarrillos (en algunos países), analiza el rostro del comprador y niega la venta a menores de edad. También puede ser utilizado para bloquear el acceso a sitios web inapropiados. Utilizando la Interacción humano-computadora donde el sistema ajusta el contenido, y visualiza únicamente productos al usuario en función de su edad. Otro ejemplo, en la aplicación de la ley. En los sistemas automáticos de edad pueden ayudar a determinar a sospechosos potenciales de manera eficiente y precisa, filtrando la base de datos y utilizando la edad estimada de la imagen de entrada. También, en la búsqueda de niños perdidos, al predecir la apariencia de un niño a partir de imágenes de fotografías anteriores [2].

 

Cabe destacar, aún con diversas propuestas presentadas a lo largo de estos años hasta la fecha no existe un método establecido para la estimación de edad, que este basada solamente en imágenes digitales, y que utilizando las características discriminantes y reduciendo a su vez, la influencia negativa de las diferencias individuales.

 

Los cambios con la edad son inevitables y muy variables, por lo tanto, se presentan una serie de factores que se deben de considerar  [3]:

 

·         Diversidad en las variaciones con la edad: los cambios físicos con la edad se dan de diversas maneras.

·         Dependencia de factores externos: la variación con la edad puede verse afectada por factores externos como la salud, condiciones de vida y la exposición a condiciones climáticas extremas.

·         Colección de datos de entrenamiento. Dado que el proceso de envejecimiento es lento, la obtención de secuencias de imágenes de una persona a diferentes edades resulta laborioso y difícil.

 

Entre los métodos para estimación de edad, se encuentra, el método basado en modelos antropométricos, el cual se basa en la teoría del crecimiento craneofacial y antropometría facial. Basándose en la evaluación antropométrica facial se hallan distancias o proporciones entre puntos fiduciales (puntos característicos de referencia o landmark), los cuales corresponden a características visibles o palpables del complejo facial, considerando que se trabaja sobre las imágenes digitales, estas características corresponden a los tejidos blandos.

 

Farkas, en su libro, Anthropometry of the face and head [4], describe un conjunto de puntos fiduciales ampliamente utilizado para la caracterización del rostro humano, comúnmente utilizado como referencia para la evaluación antropométrica y algunos otros trabajos relacionados con la ubicación de puntos característicos en el rostro.

 

El objetivo principal de este trabajo de investigación, es desarrollar una aproximación de un algoritmo que permita estimar la edad de un rostro de forma automática, capaz de manejar imágenes en condiciones no ideales (pose del rostro, tamaño de imagen, calidad, entre otras), basándose en un modelo antropométrico.  Este trabajo se divide de la siguiente manera. En la sección 2, se menciona el trabajo relacionado con respecto a las medidas antropométricas. En la sección 3, se da la propuesta de análisis de rostros y clasificación de edad usando antropometría facial. En la sección 4, se realizaron los resultados considerandos dos rangos de edad y diferentes clasificadores, y por último en la sección 5 se presentan las conclusiones.

2      TRABAJO RELACIONADO

 

ASM (Active Shape Model o Modelos de Forma Activa) propuesto en 1995 por Cootes y Taylor [5], es una de las técnicas deformable más utilizada en la segmentación de imágenes. La idea consiste en deformar una figura para encontrar formas de una imagen. Éste término apareció en 1988 en el trabajo realizado por Terzopoulos y colaboradores, sin embargo la idea original surgió mucho antes con el trabajo de Fisher y Elschlager, los Spring-loaded templates y la técnica de Rubber mask de Widrow [6, 7]. Se ha aplicado en detección de movimiento, reconocimiento de patrones y en segmentación de imágenes, principalmente en el área médica.

 

Stephen Milborrow [8], implementó el algoritmo STASM, modificaciones al algoritmo original ASM, entre las que destacan las siguientes: el modelo descriptor, el uso de descriptores Histogram Array Transforms(HAT), en lugar de descriptores de gradiente unidimensionales; uso de Multivariate Adaptive Regression Splines(MARS) para medir el ajuste entre el descriptor y el landmark a diferencia de ASM clásico, donde se emplea la distancia de Mahalanobis; en el modelo de forma. La forma inicial se alinea al triángulo formado por ojos y boca detectados en la forma promedio. A diferencia del ASM clásico, donde la forma inicial se alinea la forma promedio al rectángulo detector de rostro. Además, se añade la búsqueda multi-resolución con la creación de pirámides de nivel, en donde cada nivel de la imagen tiene diferente escala.

 

A continuación se explica la propuesta, considerando las partes de la propuesta y los clasificadores con sus respectivos algoritmos.

 

 

3      PROPUESTA

 

En este trabajo, se propone un procedimiento que permita analizar un rostro y lo clasifique en su respectivo rango de edad, basándose en estudios de antropometría facial. Esto ayuda a especificar que los puntos fiduciales y las distancias antropométricas, representan indicadores de edad en las imágenes digitales. Por otra parte, en teorías de crecimiento craneofacial para determinar los rangos de edad, cada uno, presentan índices de crecimiento en común. Dado que se propone un procedimiento automático, la detección de puntos fiduciales también debe ser automática, para ello se estudian los algoritmos existentes. La precisión en el cálculo de distancias entre puntos fiduciales es un factor importante en la clasificación, por lo cual, lo ideal es tener imágenes de frente y sin expresión facial. Sin embargo, dadas las finalidades del proyecto, se propone un pre-procesamiento para trabajar con imágenes con ligeras rotaciones y disminuir la influencia del tamaño del rostro en la imagen y la resolución, y no afectar las proporciones originales del rostro y así, propiciar un mejor resultado en la clasificación. Se considera la metodología utilizada en el reconocimiento de patrones (RP), como en la Fig. 1.

 

 

 

Figura 1 Diagrama general del clasificador de edad en RP y propuesta.

 

 

Siguiendo el esquema de reconocimiento de patrones de la Fig. 1, el procedimiento propuesto se divide en 4 partes:

 

1.       Adquisición de datos: Se obtienen las coordenadas  de los puntos fiduciales especificados con el algoritmo ASM, utilizando la implementación de código abierto stasm.

2.       Pre-procesamiento: Con la finalidad de obtener mejores resultados, se proponen procedimientos de escala y rotación.

3.       Extracción de características: En esta etapa se calculan los parámetros antropométricos seleccionados. Se especifican los conjuntos de distancias e índices involucrados.

4.       Clasificación basada en características: Se utiliza diferentes clasificadores para determinar la edad de los rostros

 

Una vez que se conocen los requerimientos necesarios se plantea, el siguiente diagrama como  propuesta  para el clasificador de edad que se muestra en la Figura 2. En las siguientes secciones de la 3.1 a la 3.4 se describe cada parte de la propuesta para describir el funcionamiento.

 

 

diagrama detalle - copia

 

Figura 2 Diagrama del clasificador de edad.

 

 

3.1   Detección de puntos fiduciales. ASM

 

En la primer parte del diagrama de la Fig. 2, está la detección de puntos fiduciales mediante el uso de Active Shape Model (ASM). La idea fundamental es crear un modelo estadístico que capture la variabilidad de un conjunto de imágenes de entrenamiento, proporcionando restricciones que permitan limitar las deformaciones posibles al modelo y generar formas válidas. ASM consiste en dos sub-modelos [9]:

 

1.       Modelo descriptor. Son utilizados para capturar las variaciones, observadas para cada landmark o punto fiducial. Este submodelo se construye en la etapa de entrenamiento, en la cual se describen lasáreas que rodean a cada punto fiducial, esto en términos de niveles de intensidad. Durante la búsqueda, se analizan áreas alrededor del punto fiducial propuesto y se modifica la posición de éstos, hacia la zona que mejor se ajuste el modelo construido. Este proceso aplicado sobre todos los landmarks, genera nuevas posiciones para los landmarks, conocido como forma sugerida (suggested shape).

 

2.       Modelo de forma (Shape Model, Modelo de Distribución de Puntos). Se define las formas permitidas (conformada por los puntos fiduciales o landmarks), construida en la etapa de entrenamiento, se modela la forma de un objeto y sus variantes. Durante la búsqueda, el modelo de forma, ajusta la forma sugerida por el modelo descriptor para evaluar la validez de la forma generada.

 

Para la detección de los puntos fiduciales se emplean las bibliotecas STASM. Se obtienen las coordenadas (x, y) de los puntos fiduciales, por defecto. Se localizan 77 puntos, que puede ser modificado a 68 o 17,  y también da la opción de entrenar el algoritmo para el número de puntos y objeto deseado [10].

 

 

3.2   ROTACIÓN Y ESCALA

 

En la segunda parte del diagrama de la Fi. 2, está la rotación y escala, después de la detección de puntos fiduciales con ASM, es necesario aplicar ciertos procedimientos para obtener un mejor resultado en la clasificación y evitar así, que influyan aspectos como diferencias en la resolución y la pose del rostro. Es importante destacar que las operaciones de rotación y escala se aplican sólo a las coordenadas (x, y) correspondientes a los puntos fiduciales.

 

a.       Rotación.

 

Se calcula el ángulo (theta) entre los puntos Exocanthion izquierdo y Exocanthion derecho, para rotar los puntos fiduciales obtenidos con ASM, de forma que las esquinas externas de los ojos queden en línea recta, ver Fig. 3. Se aplica la siguiente matriz de rotación de la Ecuación 1, esta fórmula es utilizada en el proceso de utilizar el modelo ASM [11]:

 

(1)

 

Donde i’, j’ son las coordenadas (x,y) de los puntos fiduciales.

 

a)                                             b)

 

Figura 3 Rotación de puntos fiduciales. a) Imagen original. b) Imagen al aplicar rotación.

 

 

b.       Escala.

 

La variable resolución de imágenes puede influir al categorizar a un elemento en la base de datos de un grupo de edad. Por ejemplo, si se calculan las distancias entre puntos fiduciales manteniendo las dimensiones originales, en promedio, las distancias de los rostros adultos serán superiores al de los menores de edad, sin embargo, si tenemos la imagen de un adulto, aunque con baja resolución, es decir, 123x123 píxeles, entonces será categorizado como menor de edad, de la misma manera, un menor de edad con resolución superior al promedio, 1500x1500 píxeles por ejemplo, será clasificado como mayor de edad.

 

Es por ello, que se propone un método para escalar el conjunto de imágenes a un tamaño uniforme, de tal forma que no se distorsione la forma original y mantenga las proporciones originales en cuanto a su altura y a su anchura.

 

Para realizar este proceso, se recurre al concepto de aspect ratio o relación de aspecto.Se define como un atributo que describe la relación proporcional entre el ancho y la altura de una imagen. Por ejemplo, una relación de aspecto 2:1 significa que la anchura es el doble de la altura.Para obtener la relación se divide el ancho entre la altura, ver Ecuación 2:

 

 

(2)

 

 

Una vez calculada la relación de aspecto, se elige el nuevo valor de ancho y alto que se desea y se aplica la Ecuación 3, para obtener los nuevos valores para una nueva imagen:

 

 

 

(3)

 

 

Lo anterior se aplica directamente sobre una imagen de dimensiones establecidas, sin embargo en este caso se debe aplicar a las coordenadas (x, y) de los puntos fiduciales. Para ello se obtiene un factor de escala al dividir:

 

(4)

Para obtener las nuevas coordenadas de puntos fiduciales, se multiplican los valores (x, y) por el factor obtenido, y se comprueba que la relación de aspecto persista.

 

pre_img2pre_img3

a)                                             b)

 

Figura 4 Gráficas de rostros. a) Dimensiones originales, b) Escala de imagen.

 

 

La Figura 4a, corresponde a 3 imágenes de la base de datos FG-NET [12], de acuerdo a las gráficas se podría deducir que el orden en edades es rojo (6), negro (3) y azul (12), sin embargo el rostro en color negro corresponde a una edad de 3 años, rojo a 6 años y azul a un menor de 12 años. Las diferencias se observan en la Fig. 4 y los errores al calcular las distancias serian consideradas.

 

En la Figura 4b, se muestran las gráficas de rostros después de aplicar el procedimiento de escalado en base a su relación de aspecto, se mantienen las proporciones originales y no hay distorsión de la imagen original.

 

 

3.3   CÁLCULO DE PARÁMETROS ANTROPOMÉTRICOS

 

En la tercera parte del diagrama de la figura 2, está el cálculo de parámetros antropométricos. En este trabajo se eligieron al menos 12 puntos fiduciales de los 14 presentados en la tabla 1, con los cuales se evaluaron mínimo 10 parámetros antropométricos. En la Tabla 1, se definen los puntos fiduciales del rostro que están relacionados con la edad.

 

Para la elección de los parámetros antropométricos a evaluar, se eligen aquellos que muestran cambios con la edad con respecto a las distancias [13]. Las distancias a considerar son: altura del segundo tercio del rostro (g-sn glabela-subnasale), altura de la nariz (n-sn), altura de la mandíbula (sn-m subnasal-mentón) y altura del rostro (tr-m tragión-mentón).

 

Por otra parte, se consideran las distancias que son factores discriminantes, al realizar la clasificación en grupos de edad o al calcular índices de patrones de crecimiento. Ahora se utilizan las distancias de la Tabla 2, y se incluye el índice de aspect ratio o relación de aspecto.

 

Al realizar pruebas para la correcta escala de un rostro, se encontró que la relación de aspecto cambia con la edad, esto concuerda con el crecimiento craneofacial, pues se observa un incremento de altura del rostro, y la relación entre alto y ancho del rostro también se modifica [14]. De este conjunto de parámetros se decidió omitir los correspondientes a altura y anchura de boca, que influyen por expresiones faciales como sonrisa o sorpresa. Por otra parte se omitió también la anchura de nariz, ya que después de varias pruebas realizadas se determinó que no representan un factor determinante en la clasificación.

 

Tabla 1 Definición de los puntos fiduciales seleccionados.

Punto fiducial

Notación

Definición

Exocanthion

ex

Comisura externa del ojo. Punto en el que los extremos exteriores de los párpados superior e inferior se encuentran.

Endocanthion

en

Comisura interna del ojo. Punto en el que los extremos interiores de los párpados superior e inferior se encuentran.

Nasion

n

Intersección de las suturas nasofrontales en el plano medio.

Cheilion

ch

Esquinas exteriores de la boca.

Zygion

zy

Punto ubicado en cualquiera de los extremos del diámetro bizogomático.

Gonion

go

Punto lateral en el ángulo mandibular, identificado por palpación.

Gnathion

gn

Punto situado de forma perpendicular a la sínfisis mandibular. Punto medio entre pogonion  y mentón.

Alare

al

Punto lateral en la abertura nasal en un plano transversal. Punto lateral del ala nasal.

Subnasale

sn

La unión donde la base de la columela de la nariz se encuentra con el labio superior. Punto medio en la unión entre el borde inferior del tabique nasal y el área de filtrado.

Tragion

tr

Es el punto en el plano sagital donde se inicia la línea de implantación del cabello.

Stomion

sto

Punto de la línea media de la fisura labial cuando los labios se cierran naturalmente, con los dientes cerrados en la posición natural.

Glabela

g

Punto situado en el hueso frontal y que corresponde al entrecejo.

Labiale superior

ls

Punto medio del borde bermellón del labio superior.

Labiale inferior

li

Punto medio del borde bermellón del labio inferior.

 

 

 

Tabla 2 Selección de  distancias de parámetros antropométricos.

N. Dist.

Descripción

Notación

1

Ancho intercantal

en-en

2

Ancho entre pupilas

p-p

3

Ancho de la frente

ft-ft

4

Ancho binocular

ex-ex

5

Ancho del rostro

zy-zy

6

Ancho de la mandíbula

go-go

7

Altura del rostro

tr-gn

8

Altura rostro´

n-gn

9

Altura tercio superior del rostro

tr-n

10

Altura gnathion-endocathion

gn-en

11

Altura gnathion-exocanthion

gn-ex

12

Altura gnathion- palpebrale

gn-pi

 

 

En la Fig. 5, se muestran los puntos fiduciales que se  detectan y las distancias antropométricas que se utilizan.

 

 

 

Figura 5 Puntos fiduciales y distancias.

 

 

3.4   CLASIFICACION EN RANGOS DE EDAD

 

Obtenidas las distancias antropométricas, en la cuarta parte del diagrama de la Fig. 2, se realiza la clasificación bajo dos rangos de edad [15-17]:

 

1.       De 1-15 años. Se considera el número de imágenes de entrenamiento y el porcentaje de crecimiento en este rango de edad es alto, debido a los periodos de niñez y adolescencia.

2.       De 16-25 años. En este periodo de edad hay crecimiento, sin embargo no es tan alto como en el rango anterior, porque las facciones se mantienen en estas edades.

 

Solo se utilizan esos dos rangos ya que las edades de 26 a 40 años se observa estabilidad en cuanto a crecimiento. En mayores de 40 años se dan los primeros signos de envejecimiento, como el comienzo de pliegue hacia bajo de las esquinas de la boca y notoriedad en la línea del cabello. En este rango de edad no hay crecimiento del rostro, algunas proporciones pueden modificarse como consecuencia de efectos de envejecimiento. Para un rango específico, más alto que los 40 años, se sugiere complementar con otras técnicas como detección de arrugas [18].

 

Para el proceso de clasificación se utilizó Weka y cuatro algoritmos de clasificación corresponden a las tres categorías: geométrica (que utiliza conceptos geométricos como líneas, planos, distancias, hiperplanos), probabilística (se interesa en modelar la relación entre X e Y, donde X es una variable conocida y Y es la variable desconocida) lógica (basados en reglas). Así que se eligieron: Máquinas de soporte vectorial (SVM) y Knn de la primera categoría, Naive Bayes y C4.5 de las siguientes categorías respectivamente. Los algoritmos de clasificación empleados se describen brevemente a continuación.

 

a.       Máquinas de soporte vectorial

 

Los algoritmos basado en máquinas de soporte vectorial (SVM), dado un espacio de puntos (datos de entrada que constituye un vector n-multidimencional)  en el que cada uno de ellos pertenece a una de dos categorías, construye un modelo capaz de predecir si un punto nuevo (cuya categoría se desconoce) pertenece a una categoría o a la otra.

 

Las SVM buscan un hiperplano que separe de forma óptima a los puntos de una clase de la otra. El concepto de separación óptima constituye la característica fundamental de estos algoritmos, ya que buscan el hiperplano que tenga la máxima distancia (margen) con los puntos que estén más cerca de él mismo. De esta forma, los puntos del vector que son etiquetados con una categoría estarán a un lado del hiperplano y los casos que se encuentren en la otra categoría estarán al otro lado.

 

b.       Knn

 

Este algoritmo asigna un dato nuevo, a la clase que le corresponde, según tenga k vecinos más cerca de una clase o de otra. El parámetro k (número de vecinos) se determina de acuerdo a las condiciones del problema o experimentación. Para asignar la clase a un dato nuevo, se calcula la distancia del elemento nuevo a cada uno de los existentes, y se ordenan dichas distancias de menor a mayor para ir seleccionando la clase a la que pertenece. Esta clase será, por tanto, la de elementos de mayor frecuencia con menores distancias al nuevo dato. En Weka su implementación es Ibk.

 

c.        Näive Bayes

 

Un clasificador Bayesiano ingenuo es un clasificador probabilístico fundamentado en el teorema de Bayes y la hipótesis. Para calcular a que clase Cipertenece un conjunto de datos E, se utiliza el teorema de Bayes que permite calcular la probabilidad de obtener cierta clase Ci de los datos E, ver Ecuación 5.

 

 

(5)

 

 

Donde:

P(Ci|E) es la probabilidad posterior que se desea calcular.

P(Ci)  es la probabilidad a priori de Ci.

P(E|Ci) es la probabilidad de los datos dada una cierta clase.

P(E) es la probabilidad a priori de los datos. 

 

 

d.       C4.5

 

Es un algoritmo usado para generar un árbol de decisión. En Weka la implementación del algoritmo C4.5 es J48. C4.5 es un algoritmo para construir árboles de decisión desde un grupo de datos de entrenamiento, utiliza el concepto de entropía de información. En cada nodo del árbol, C4.5 coloca el atributo de los datos, que de manera más eficaz dividen el conjunto de muestras en subconjuntos  de una clase u otra.

 

 

4      PRUEBAS REALIZADAS

 

Se realizan experimentos para dos rangos de edad: 1-15, 16-25 esto debido a que en edades mayores a los 26 años hay una cierta estabilidad de crecimiento en las dimensiones faciales, mismas que pueden modificarse en edades avanzadas.

 

Se utilizó la base de datos FG-Net que contiene 1002 imágenes de 82 personas diferentes, con rango de edad entre 0 y 69 años, edades entre los 40 años, existen mayor número de imágenes. Se conjuntan mediante el escaneo de fotografías, parte de colecciones personales de diferentes personas.

 

FG-NET se considera como una base de datos en un ambiente no controlado, pues hay una variabilidad en la resolución de la imagen, nitidez de la imagen, iluminación y expresión facial. Se presenta oclusión de rasgos faciales por iluminación, accesorios (gafas, gorra, sombrero) o vello facial (bigote).

 

Se seleccionan de forma manual, las imágenes que contenían un rostro de frente, el número de imágenes por rango de edad se define en la Tabla 3.

 

Tabla 3 Número de imágenes para cada rango de edad. Base de datos FG-NET.

Grupos de edad

Imágenes

1-15

365

16-25

165

Total

530

 

 

En la Tabla 4, se muestran los valores promedios y desviación estándar correspondiente de algunos parámetros antropométricos [19].

 

Observando en la tabla 4, existe un aumento de tamaño en ciertos parámetros. Por ejemplo el parámetro tr-gn, el cual representa la altura total del rostro, aumenta del primer al segundo grupo. En cuanto a valores de aspect ratio, se nota una disminución entre el primer y segundo grupo de edad, esto debido a que, en este periodo es donde se dan los mayores cambios.

 

Siendo los tres parámetros Altura gnathion-endocathion, Altura gnathion-exocanthion y Altura gnathion- palpebraleusados con frecuencia en el calculo de ratios en el rostro (aspect ratio).

Algunos otros parámetros antropométricos aumentan de forma muy reducida, ejemplo de ello es el ancho intercantal, donde el valor medio es relativamente semejante en los dos rangos de edad.

 

 

Tabla 4 Valores promedio y desviación estándar de algunos parámetros antropométricos.

2 grupos de edad

 

Media +

Desviación estándar

Distancia 5. zy-zy

1-15

196.66  ± 3.44

16-25

197.90  ± 2.47

Distancia 1. en-en

1-15

57.182  ± 3.69

16-25

57.018  ± 3.28

Distancia 6. go-go

1-15

121.90  ± 10.49

16-25

124.85  ± 9.91

Distancia 7. tr-gn

1-15

263.90  ± 13.02

16-25

271.96  ± 11.89

   Distancia. Aspect ratio

1-15

0.759  ± 0.037

16-25

0.737  ± 0.032

 

 

Uno de los propósitos de estimar el rango de edad de un rostro a partir de su imagen, es poder trabajar con imágenes de internet, las cuales son variadas en numerosos aspectos.

 

Cabe mencionar que las imágenes fueron seleccionados de forma aleatoria de la base de datos original, lo cual indica que los rostros no son precisamente de frente, además que el número de imágenes por grupo es diferente, para el caso de edades de 1 a 15 años, se tiene un mayor número de imágenes.

 

La exactitud es una medida de la matriz de confusión que facilita la detección de posibles falsos positivos [20]. Una matriz de confusión muestra a detalle las clasificaciones correctas e incorrectas para cada clase, ver Tabla 5.

 

Tabla 5Matriz de confusión.

 

Predicted 1

Predicted 0

True 1

Tp

Fp

True 0

Fn

Tn

 

 

Considerando:

 Verdaderos positivos (true positive).

 Falsos positivos (false positive)

 Falsos negativos (false negative)

 Verdaderos negativos (true negative)

 

Se define la siguiente métrica de evaluación.

Exactitud (Accuracy): Mide la frecuencia con la que un clasificador realiza predicciones correctas. Es el radio entre el número de predicciones correctas y el total de predicciones, es decir, el total de elementos de prueba. Mientras más cercano sea al valor a 1, la exactitud será mejor (ver Ecuaciones 8 y 9).

(8)

 

 

(9)

 

 

Donde C es el numero de clases cuando se realiza multiclase.

 

Las imágenes seleccionadas se clasificaronen la plataforma Weka [21] con los algoritmosSVM,Knn (de 1 a 10 vecinos obteniendo mejores resultados con 7), Näive Bayes (nb) y c4.5. Se ejecutaron utilizando validacióncruzada a n pliegues. En esta técnica de validación cruzada, lo que se hace es dividir el conjunto de entrenamiento en k subconjuntos, uno de los subconjuntos se usa como prueba y los otros k-1 como conjuntos deentrenamiento. Esto se realiza n veces y se extrae la media aritmética de cada una de las divisiones realizadas, para saber la exactitud final del modelo entrenado [22].

Para los experimentos realizados se utilizó validación cruzada a 10 pliegues es decir con nigual a 10 [23]. Los resultados obtenidos son los siguientes:

Tabla 6Validación cruzada con 10 pliegues en Weka.

Número de Imágenes

Clasificador

Exactitud

530

SVM

0.7433

539

Knn (7 vecinos)

0. 7528

530

NB

0.7056

530

C4.5

0.7169

 

 

5      CONCLUSIONES

 

En este trabajo se realizó la clasificación de un rostro en dos diferentes rangos de edad, utilizando sólo la imagen digital del rostro. Una de las mayores dificultades presentadas en los experimentos, fue el de encontrar una base de datos amplia para fines de estimación de edad, si bien, se utilizó la FG-Net, en su mayoría contienen más imágenes digitales de un grupo de edad que de otro, lo cual influye en la clasificación final.

 

Los mejores resultados se obtuvieron con el algoritmo de clasificación Knn con 7 vecinos, con un 75% de exactitud, considerando que las imágenes no son completamente de frente y por lo tanto existen variantes en la distancias seleccionadas como atributos, sin embargo estás parecen comportarse satisfactoriamente.

 

Como trabajo a futuro se propone el conjuntar una base de datos con igual número de imágenes para cada grupo, además de validar de forma automática que los rostros se encuentren en las condiciones adecuadas, pues seleccionar las imágenes de forma manual, dada la percepción del humano al visualizar las imágenes, no siempre es la correcta. Si bien los porcentajes obtenidos en este trabajo son del 75%,  se pretende mejorar los procedimientos de obtención de las medidas antropométricas con mucha probabilidad, llegar a resultados más cercanos a 1, en exactitud y hacer factible la aplicación del método propuesto a rostros de imágenes digitales que se encuentran en el Internet, con alta variabilidad.

 

 

6      AGRADECIMIENTOS

 

Agradecemos a la Vicerrectoría de Investigación y Posgrado de la Benemérita Universidad Autónoma de Puebla por el apoyo brindado para realizar esta investigación.

 

 

7      REFERENCIAS

 

[1]    Rhodes, M. (1995). Age estimation of faces: A review. Applied Cognitive Psychology, 23 (1), 1-12.doi: 10.1002/acp.1442.

[2]    Han, H., Otto, C., Jain, A. K. (2013). Age estimation from face images: Human vs. machine performance.The 6th IAPR International Conference on Biometrics (ICB), Madrid, Spain.

[3]    Wang, S., Zhou, C., Sun, M, Chen, H., Liu, X., Peng, X. (2011). Can estimate age range using’a face person?. Journal of Computational Information Systems, 7(13), 4586-4593.

[4]    Farkas, L. (1994) Anthropometry of the head and face. (2da. Ed.) New York: Raven Press.

[5]    Cootes, T. F., Taylor, C. J., Cooper, D. H., Graham, J. (1995). Active shape models-their training and application. Computer vision and image understanding, 61(1), 38-59. doi:https://doi.org/10.1006/cviu.1995.1004

[6]    Mejía-Molina, N. (2013). Modelos deformables. [versión electrónica] Maestría en Ingeniería de Sistemas y Computación, Pontificia Universidad Javeriana. Recuperado  de: http://pegasus.javeriana.edu.co/~PI131-05-DefModMedicos/Documentos/MISyC%20TG%20-%20EstadoDelArte%20-%20%20Nadia%20Mejia%20-%202013-05-24.pdf

[7]    Xu, C., Pham, D. L., Prince, J. L. (2000). Image Segmentation Using Deformable Models. En Fitzpatrick, J. M, Sonka, M (Eds.), Handbook of Medical Imaging, Volume 2: Medical Image Processing and Analysis (pp. 129-174) SPIE Press.

[8]    Milborrow, S. (2016). Multiview Active Shape Models with SIFT Descriptors. (Tesis Doctoral). Faculty of Engineering, University of Cape Town.

[9]    Iqtait, M., Mohamad, F. S, Mamat, M.(2018). Feature extraction for face recognition via Active Shape Model (ASM) and Active Appearance Model (AAM). IOP Conf. Series: Materials Science and Engineering, 332 (012032), 1-8. doi:10.1088/1757-899X/332/1/012032.

[10] Milborrow, S., Nicolls, F. (2014). Active shape models with SIFT descriptors and MARS. Proceedings of theIEEE International Conference on Computer Vision Theory and Applications (VISAPP), (pp. 380-387). Lisbon, Portugal.

[11] Wang, N., Gao, X., Tao, D., Yang, H., Li, X. (2017). Facial feature point detection: A comprehensive survey. Neurocomputing. Journal Neurocomputing, 275 (C), 50-65.

[12] FG-NET Aging Database, (2002). Homepage. Computer Vision for Human-Computer Interaction Lab. Recuperado de: http://yanweifu.github.io/FG_NET_data/FGNET.zip

[13] Caple, J., Stephan, C. N. (2016). A standardized nomenclature for craniofacial and facial anthropometry. International Journal of legal medicine, 130 (3), 863-879.

[14] Dooley, M. (1982). Anthropometric modeling programs-A survey. IEEE Computer Graphics and Applications, 2, 17-25.

[15] Zhuang, Z., Landsittel, D., Benson, S., Roberge, R., Shaffer, R. (2010). Facial anthropometric differences among gender, ethnicity, and age groups. Annals of occupational hygiene, 54(4), 391-402.

[16] Ramanathan, N., Chellappa, R. (2006). Modeling age progression in young faces. Proceedings IEEE Computer Society Conference on Computer Vision and Pattern Recognition, (pp. 387-394), New York, USA.

[17] Jahanbin, A., Mahdavishahri, N., Baghayeripour, M., Esmaily, H., Eslami, N. (2012), Evaluation of facial anthropometric parameters in 11-17 year old boys. Journal of Clinical Pediatric Dentistry, 37 (1), 95-101.

[18] Colmenares-Guillen, L. E., Martínez Cruz, A. E., Albores Velasco, F. J., Pérez de Celis Herrero, M. C. (2016). Algorithm approach of a classifier based on aging wrinkle analysis. International Journal of Innovation and Applied Studies, 18 (1), 1-11.

[19] Otaño Lugo, R., Otaño Laffitte, G., Fernández Ysla, R., (2009). Crecimiento y Desarrollo Craneofacial. 1-32. Recuperado de: http://articulos.sld.cu/ortodoncia/files/2009/12/crec-y-des-preg.pdf

[20] Sokolova, M., Lapalme, G. (2009). A systematic analysis of performance measures for classification tasks. Information Processing & Management, 45(4), 427-437.

[21] Weka 3: Data Mining Software in Java. Recuperado de: https://www.cs.waikato.ac.nz/ml/weka

[22] Hernández O., Ramírez, Q., Ferri, R. (2004). Introducción a la minería de datos. (1a ed.). Madrid:  Pearson educación.

[23] Zamorano Ruiz, J. Comparativa y análisis de algoritmos de aprendizaje automático para la predicción del tipo predominante de cubierta arbórea. (Trabajo Fin Máster). Ingeniería de Computadores, Facultad de Informática departamento de sistemas informáticos y Computación. Universidad Complutense de Madrid. Recuperado de: https://eprints.ucm.es/48800/1/Memoria%20TFM%20Machine%20Learning_Juan_Zamorano_para_difundir%20%282%29.pdf