¿Qué es Machine Learning?

 En Data Science

Actualmente nos encontramos en la era de Big Data, donde todos nos estamos generando cantidades masivas de información, por ejemplo nuestro teléfono genera información sobre nuestra localización, nuestras llamadas, nuestras fotos, nuestros datos bancarios, datos de comportamiento entre otros.

Existen aproximadamente 40 mil millones de páginas indexadas, 100 horas de video se suben a YouTube cada minuto; es por esto que surge la necesidad de utilizar la vasta información disponible para comprender el mundo de una mejor manera.

Machine Learning es un conjunto de métodos que nos permiten detectar patrones en la información y luego usar estos patrones para predecir datos futuros o realizar otro tipo de decisiones con la información.

Regularmente se clasifica en dos ramas:

Supervised Learning:

Esta rama de Machine Learning se caracteriza en que los datos ya cuentan con el resultado deseado es decir, el conjunto de la información con la que se trabaja ya  tiene un atributo que deseamos conocer, por ejemplo, al categorizar un mail de spam, existen una gran cantidad de ejemplos de correos spam, entonces al analizar un nuevo correo podemos identificar si este pertenece o no a cierta categoría.

Unsupervised Learning:

En esta rama de Machine Learning los datos con los que se trabajan no tienen un atributo o etiqueta el cual queremos conocer, en este tipo de datos se trabaja para descubrir nueva información sobre un conjunto de datos, ¿cómo se distribuyen?, ¿existe algún patrón en los datos? Son las principales preguntas que responde Unsupervised Learning.

 

Al realizar los modelos debemos de ser muy cuidadosos, ya que estos modelos al estar preconfigurados, pueden llevarnos a cometer errores. El caso más común es el de sobre ajuste, en el que el usuario configura su modelo para que satisfaga los datos y este no genera ningún tipo de información nueva. Un ejemplo de esto es una regresión polinomial que al tener un grado mayor, nuestro resultado se ajustara casi perfectamente a nuestros datos, generando la impresión de exactitud cuando la realidad es que es un sobre ajuste en el modelo.

Machine Learning es utilizado en diferentes industrias para diferentes objetivos, la clasificación de spam es un ejemplo, pero existen otros como, los métodos de recomendación (Netflix, Amazon), métodos de clasificación en finanzas (Scorings),  métodos de detección de fraude, métodos de descubrimiento de tendencia en el mercado de valores, métodos de reconocimiento de voz (Siri), etc. La posibilidad de los usos de Machine Learning es casi infinita, pero la realidad es que el desconocimiento de estas herramientas limita el crecimiento de las empresas y organizaciones, por lo que las nuevas empresas líderes en los mercados deberán de ser expertos en esta materia.

 

At first, we sample f(x) in the N (N is odd) equidistant points around x^*:

    \[f_k = f(x_k),\: x_k = x^*+kh,\: k=-\frac{N-1}{2},\dots,\frac{N-1}{2}\]

where h is some step.
Then we interpolate points \{(x_k,f_k)\} by polynomial

(1)   \begin{equation*}  P_{N-1}(x)=\sum_{j=0}^{N-1}{a_jx^j} \end{equation*}

Its coefficients \{a_j\} are found as a solution of system of linear equations:

(2)   \begin{equation*}  \left\{ P_{N-1}(x_k) = f_k\right\},\quad k=-\frac{N-1}{2},\dots,\frac{N-1}{2} \end{equation*}

Here are references to existing equations: (1), (2).
Here is reference to non-existing equation (??).

Publicaciones Recientes

Deja un Comentario

Contact Us

We're not around right now. But you can send us an email and we'll get back to you, asap.

Cambiar el Texto captcha txt

Start typing and press Enter to search