Aproximación a la metodología basada en árboles de decisión (CART): Mortalidad hospitalaria del infarto agudo de miocardio Approach to the methodology of classification and regression trees

Objetivo: : Realizar una aproximación a la metodología de árboles de decisión tipo CART (Classification and Regression Trees) desarrollando un modelo para calcular la probabilidad de muerte hospitalaria en infarto agudo de miocardio (IAM). Método: Se utiliza el conjunto mínimo básico de datos...

Full description

Saved in:
Bibliographic Details
Main Authors: Javier Trujillano (Author), Antonio Sarria-Santamera (Author), Aureli Esquerda (Author), Mariona Badia (Author), Matilde Palma (Author), Jaume March (Author)
Format: Book
Published: Elsevier, 2008-02-01T00:00:00Z.
Subjects:
Online Access:Connect to this object online.
Tags: Add Tag
No Tags, Be the first to tag this record!

MARC

LEADER 00000 am a22000003u 4500
001 doaj_83d17a00d44b4b9ba78e312581ce4080
042 |a dc 
100 1 0 |a Javier Trujillano  |e author 
700 1 0 |a Antonio Sarria-Santamera  |e author 
700 1 0 |a Aureli Esquerda  |e author 
700 1 0 |a Mariona Badia  |e author 
700 1 0 |a Matilde Palma  |e author 
700 1 0 |a Jaume March  |e author 
245 0 0 |a Aproximación a la metodología basada en árboles de decisión (CART): Mortalidad hospitalaria del infarto agudo de miocardio Approach to the methodology of classification and regression trees 
260 |b Elsevier,   |c 2008-02-01T00:00:00Z. 
500 |a 0213-9111 
520 |a Objetivo: : Realizar una aproximación a la metodología de árboles de decisión tipo CART (Classification and Regression Trees) desarrollando un modelo para calcular la probabilidad de muerte hospitalaria en infarto agudo de miocardio (IAM). Método: Se utiliza el conjunto mínimo básico de datos al alta hospitalaria (CMBD) de Andalucía, Cataluña, Madrid y País Vasco de los años 2001 y 2002, que incluye los casos con IAM como diagnóstico principal. Los 33.203 pacientes se dividen aleatoriamente (70 y 30 %) en grupo de desarrollo (GD = 23.277) y grupo de validación (GV = 9.926). Como CART se utiliza un modelo inductivo basado en el algoritmo de Breiman, con análisis de sensibilidad mediante el índice de Gini y sistema de validación cruzada. Se compara con un modelo de regresión logística (RL) y una red neuronal artificial (RNA) (multilayer perceptron). Los modelos desarrollados se contrastan en el GV y sus propiedades se comparan con el área bajo la curva ROC (ABC) (intervalo de confianza del 95%). Resultados: En el GD el CART con ABC = 0,85 (0,86-0,88), RL 0,87 (0,86-0,88) y RNA 0,85 (0,85-0,86). En el GV el CART con ABC = 0,85 (0,85-0,88), RL 0,86 (0,85-0,88) y RNA 0,84 (0,83-0,86). Conclusiones: Los 3 modelos obtienen resultados similares en su capacidad de discriminación. El modelo CART ofrece como ventaja su simplicidad de uso y de interpretación, ya que las reglas de decisión que generan pueden aplicarse sin necesidad de procesos matemáticos.<br>Objective: To provide an overview of decision trees based on CART (Classification and Regression Trees) methodology. As an example, we developed a CART model intended to estimate the probability of intrahospital death from acute myocardial infarction (AMI). Method: We employed the minimum data set (MDS) of Andalusia, Catalonia, Madrid and the Basque Country (2001-2002), which included 33,203 patients with a diagnosis of AMI. The 33,203 patients were randomly divided (70% and 30%) into the development (DS; n = 23,277) and the validation (VS; n = 9,926) sets. The CART inductive model was based on Breiman's algorithm, with a sensitivity analysis based on the Gini index and cross-validation. We compared the results with those obtained by using both logistic regression (LR) and artificial neural network (ANN) (multilayer perceptron) models. The developed models were contrasted with the VS and their properties were evaluated with the area under the ROC curve (AUC) (95% confidence interval [CI]). Results: In the DS, the CART showed an AUC = 0.85 (0.86-0.88), LR 0.87 (0.86-0.88) and ANN 0.85 (0.85-0.86). In the VS, the CART showed an AUC = 0.85 (0.85-0.88), LR 0.86 (0.85-0.88) and ANN 0.84 (0.83-0.86). Conclusions: None of the methods tested outperformed the others in terms of discriminative ability. We found that the CART model was much easier to use and interpret, because the decision rules generated could be applied without the need for mathematical cal 
546 |a EN 
546 |a ES 
690 |a Árboles de decisión 
690 |a Red neuronal artificial 
690 |a Regresión logística 
690 |a Classification and Regression Trees 
690 |a Artificial Neural Networks 
690 |a Logistic Regression 
690 |a Public aspects of medicine 
690 |a RA1-1270 
655 7 |a article  |2 local 
786 0 |n Gaceta Sanitaria, Vol 22, Iss 1, Pp 65-72 (2008) 
787 0 |n http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S0213-91112008000100013 
787 0 |n https://doaj.org/toc/0213-9111 
856 4 1 |u https://doaj.org/article/83d17a00d44b4b9ba78e312581ce4080  |z Connect to this object online.