4 mitos sobre como iniciar um projeto de aprendizado de máquina

Autor: Laura McKinney
Data De Criação: 3 Abril 2021
Data De Atualização: 15 Poderia 2024
Anonim
4 mitos sobre como iniciar um projeto de aprendizado de máquina - Tecnologia
4 mitos sobre como iniciar um projeto de aprendizado de máquina - Tecnologia

Contente


Fonte: monsitj / iStockphoto

Leve embora:

Aprenda sobre esses mitos do aprendizado de máquina para se orientar melhor para a adoção da empresa.

Não é uma tarefa fácil - começar com um projeto de aprendizado de máquina pode ser um processo assustador para executivos que desejam tirar vantagem dessa tendência de TI, mas podem não ter o conhecimento interno para realmente entender os meandros do que faz a máquina projetos de aprendizagem.

Aqui, falaremos sobre alguns dos equívocos básicos que estão afetando o modo como as empresas desenvolvem tecnologias de aprendizado de máquina em um mercado em rápida mudança. (A ciência de dados é outro campo que as empresas estão implementando, mas como é diferente da ML? Descubra em Ciência de Dados ou Machine Learning? Aqui está como identificar a diferença.)

Mito 1: mais dados são sempre melhores

Este é realmente um dos maiores mitos do aprendizado de máquina. As pessoas pensam que mais dados significa mais capacidade de aprimorar insights acionáveis. Em alguns casos, eles estão certos, mas com mais frequência, o inverso pode ser verdadeiro.


Mais dados são melhores apenas se forem dados relevantes que contribuem para a imagem inteira. Os dados precisam se encaixar no modelo de aprendizado de máquina, ou o programa pode sofrer de algo chamado "sobreajuste", onde os resultados do aprendizado de máquina não aparecem da maneira que deveriam.

“A causa do baixo desempenho no aprendizado de máquina é super ou pouco ou muito inadequado dos dados”, escreve Jason Brownlee no Machine Learning Mastery.

Nas estatísticas, um ajuste se refere a quão bem você aproxima uma função de destino. Essa é uma boa terminologia para uso no aprendizado de máquina, porque os algoritmos de aprendizado de máquina supervisionados procuram aproximar a função de mapeamento subjacente desconhecida para as variáveis ​​de saída, dadas as variáveis ​​de entrada. As estatísticas geralmente descrevem a qualidade do ajuste, que se refere a medidas usadas para estimar quão bem a aproximação da função corresponde à função de destino.


Simplificando, dados estranhos podem causar problemas sérios. Antes de definir um projeto de aprendizado de máquina, os executivos e outras partes interessadas precisam fazer um brainstorming e descobrir quais são os tipos específicos de dados que fornecerão a base certa para avançar.

Mito 2: Os dados que temos são bons o suficiente

Novamente, os processos de aprendizado de máquina funcionam em modelos de dados muito precisos. Os dados não são bons o suficiente, a menos que sejam claramente segmentados e selecionados ou avaliados para levar em conta coisas como preconceito e variação.

Sem erros, sem estresse - seu guia passo a passo para criar software que muda vidas sem destruir sua vida

Você não pode melhorar suas habilidades de programação quando ninguém se importa com a qualidade do software.

Uma coisa que você ouve muito no mundo do aprendizado de máquina é o viés descontrolado. O aprendizado de máquina pega nossos preconceitos humanos e os amplifica produzindo os dados que o programa obtém em resultados potencialmente extremos.

Isso significa que os dados precisam ser extra direcionados para compensar essa tendência.

Mito 3: é muito cedo para nós!

Algumas empresas temem que seja muito cedo para elas estarem aprendendo a aprender máquinas. Mas se você conversar com muitos inovadores e empreendedores, eles dirão que é exatamente a hora de entrar no térreo.

Onde quer que esteja essa tendência de TI, você quer estar à frente da curva. Na vanguarda é a melhor posição. Esperar que tudo fique perfeito pode custar um negócio a longo prazo. (Para saber mais sobre os motivos pelos quais as empresas ainda não implementaram o ML, consulte 4 obstáculos que impedem a adoção do aprendizado de máquina.)

Mito 4: o aprendizado de máquina é sempre o mesmo

Definitivamente, existe um amplo espectro de programas de aprendizado de máquina.

Alguns deles fogem basicamente de um único algoritmo - são matematicamente legíveis e transparentes. Os engenheiros podem ver como os dados inseridos se correlacionam com o que sai do sistema.

Outros processos de aprendizado de máquina são muito mais elaborados e difíceis de entender. As redes neurais compostas por neurônios artificiais podem se tornar essencialmente uma "caixa preta", onde até os melhores engenheiros têm dificuldade em rastrear dados através do sistema ou explicar como os algoritmos funcionam.

"As tecnologias mais capazes - ou seja, redes neurais profundas - são notoriamente opacas, oferecendo poucas pistas sobre como elas chegam a suas conclusões", escreve Ariel Bleicher, da Scientific American, analisando aspectos desse enigma essencial.

Ferramentas como redes de estado de eco pegam essa ideia de caixa preta e correm com ela. Isso torna ainda mais difícil realmente verificar completamente como esses sistemas funcionam.

Mito 5: o aprendizado de máquina funciona apenas com dados cuidadosamente selecionados

Embora o ponto acima sobre dados de precisão ainda seja verdadeiro, dois tipos diferentes de aprendizado de máquina funcionam de maneira fundamentalmente diferente.

Um tipo de aprendizado de máquina chamado aprendizado de máquina supervisionado lida com dados rotulados - os dados de treinamento já possuem rótulos para descrever suas propriedades e categorias.

Outro tipo de aprendizado de máquina é chamado aprendizado de máquina não supervisionado. Ele lida com dados não rotulados.

O aprendizado de máquina não supervisionado utiliza dados brutos, e a máquina os analisa essencialmente por características e os agrupa em categorias por conta própria. Há muito potencial nos dois tipos de aprendizado de máquina, mas é mais fácil configurar um programa com dados rotulados para aprendizado de máquina supervisionado. O aprendizado de máquina não supervisionado é uma espécie de águas desconhecidas para muitas empresas.

Essas são algumas das considerações que você pode ter e conceitos errados sobre o aprendizado de máquina que podem causar problemas na adoção da empresa. Espero que isso tenha ajudado a esclarecer algumas confusões sobre projetos de aprendizado de máquina.