Lo que comenzó como una cena informal entre dos investigadores muy diferentes en 2016, uno un científico de datos e ingeniero, el otro un experto en modelos económicos, se ha convertido desde entonces en un artículo de revista que cuantifica los efectos de la “prima de belleza”, la noción de que aquellos que son más atractivos físicamente tienden a tener mayores ingresos. El ingeniero del equipo de investigación es Stephen Baek, profesor asociado de ciencia de datos en la Universidad de Virginia (UVA), mientras que el econométrico es Suyong Song, profesor asociado de economía y finanzas en la Universidad de Iowa. Hace cinco años, los dos descubrieron que sus intereses de investigación se superponían más de lo que inicialmente se dieron cuenta, lo que provocó que surgiera una idea inesperada.
Baek comenzó su colaboración con Song como investigador en Iowa antes de unirse a la facultad de UVA School of Data Science en agosto de 2021. En su trabajo anterior, Baek analizó y modeló formas del cuerpo humano para aplicaciones de ingeniería como diseño de productos, moda virtual, diseño de prendas y ergonomía. Song, por otro lado, aportó su experiencia en el estudio de modelos económicos que adolecen de errores de medición y generación de informes.
En comparación con las publicaciones anteriores sobre la prima de la belleza, los métodos de investigación de Baek y Song son novedosos, debido a la naturaleza de su conjunto de datos, que provienen del proyecto de recursos de antropometría de superficie civil americana y europea de 2002, o CAESAR. Además de las medidas de altura y peso autoinformadas, que se han utilizado en estudios anteriores, el proyecto también recopiló datos escaneados en 3D del cuerpo, información extensa sobre ingresos demográficos y familiares, así como medidas corporales con cinta métrica y calibre de casi 2400 civiles. Con estos datos, los dos investigadores podrían proporcionar una historia más rica de la apariencia física y las variables socioeconómicas.
“El problema con los trabajos anteriores era que la gente simplificaba demasiado los parámetros para describir la forma del cuerpo”, dijo Baek. “Los procesos tradicionales para determinar la apariencia física, como la estatura, el peso y el IMC, son procesos imperfectos y, por lo tanto, no son capaces de capturar todas las dimensiones de la forma del cuerpo humano”.
Utilizando un novedoso algoritmo de aprendizaje automático llamado “codificador automático gráfico” o “aprendizaje automático profundo”, se introdujeron los escaneos 3D para codificar características geométricas de la forma del cuerpo humano. Después de que la máquina se introdujo en miles de escaneos individuales, el algoritmo redujo la dimensionalidad de los datos, de unos pocos cientos de miles de puntos a unas pocas características importantes, caracterizando cada forma del cuerpo humano utilizando valores numéricos. Luego, Baek y Song visualizaron las características para determinar a qué partes del cuerpo hacía referencia el algoritmo y estimaron sus relaciones con las variables socioeconómicas. Usando este enfoque científico, se podrían cuantificar los efectos causales de la apariencia física.
Para las submuestras de hombres y mujeres, la estatura y la obesidad fueron características importantes, mientras que la relación cadera-cintura fue una característica adicional única en la apariencia física de las mujeres. Los resultados empíricos encontraron que una mayor estatura en los hombres se correlacionó con un mayor ingreso familiar, mientras que una mayor obesidad en las mujeres se correlacionó con un menor ingreso familiar.
Además de sus hallazgos con respecto a la prima de la belleza, la experiencia de Song en modelos económicos agregó otra capa a sus hallazgos: el papel negativo que juegan los errores de encuesta y medición en los estudios que utilizan mediciones corporales. Según sus cálculos, que fueron posibles por el hecho de que los datos de 2002 también incluían medidas corporales autoinformadas, Song descubrió que el error en los informes estaba altamente correlacionado con el peso y la estatura reales. En promedio, los individuos de peso más liviano tendían a reportar en exceso su peso, mientras que los individuos más pesados tendían a reportar menos. Los hallazgos demostraron que los errores de la encuesta con respecto a estas mediciones son sustanciales, y que los estudios anteriores que utilizan datos de encuestas autoinformados probablemente se vean afectados por ello. Song explicó que cuando se ejecutan modelos de regresión en los que las variables económicas sufren errores de encuesta o de medición, la estimación se sesga, desdibujando la relación correcta.
“Para abordar el problema del error, muchos economistas asumen que estos errores son insignificantes o que son cero en promedio”, dijo Song. “Sin embargo, nuestro estudio mostró que no son insignificantes y no son cero en promedio, sino que más bien mostró que están correlacionados con la altura o el peso reales, lo que alarma a muchos estudios que utilizan datos de encuestas”.
Inicialmente, Song anticipó una audiencia objetivo de economistas y estadísticos, pero con estos hallazgos, desde entonces se ha dado cuenta del impacto más amplio del tema en campos como la ingeniería, la informática, la biología y las ciencias sociales. Tres años después de su presentación inicial, el artículo de investigación, El físico: evidencia del aprendizaje automático sobre la relación entre el físico y los ingresos, en la revista de acceso abierto PLOS One. Con mayor publicidad, Baek y Song no solo esperan presentar el alcance del error en estudios previos sobre la forma del cuerpo que se basaron en datos de encuestas autoinformados, sino también generar conciencia sobre el tema de las primas de belleza.
Fuente: Phys.org.