Aprendizado de Máquina acessível para SEOs — Whiteboard Friday-Moz

O aprendizado de máquina-um ramo da inteligência artificial que estuda a melhoria automática de algoritmos de computador-pode parecer muito fora   do escopo do seu trabalho de SEO. MozCon speaker (e all-around SEO genius) Britney Muller está aqui com uma edição especial de   Whiteboard Friday para dizer por que isso não é verdade, e para passar por alguns passos para que você tenha começado. Você pode acessar o notebook Colab discutido no vídeo aqui.  

Para ver mais sobre aprendizado de máquina   a partir de Britney e nossas outras apresentações do MozCon 2020, confira o pacote de vídeos deste ano.  

Get my MozCon 2020 video bundle

Clique na imagem whiteboard acima para abrir uma versão em alta resolução em uma nova guia!

Transcrição de vídeo

Hey, fãs da Moz. Bem-vindo a esta edição especial de Whiteboard Friday. Hoje estamos dando uma espiadinha no que eu falei no MozCon 2020, onde fiz machine learning acessível a SEOs em todos os lugares.

Isso é tão, tão excitante porque está prontamente em suas pontas dos dedos hoje, e eu vou mostrar exatamente como começar.  

Então, para dar um pontapé em coisas, aprendi sobre esse conceito estranho chamado parasitas de brood neste verão, e é fascinante. É basicamente onde um animal engana outro animal da mesma espécie para criar seus jovens.

É fascinante, e quanto mais eu aprendi sobre isso, mais eu percebi: oh meu gosh, eu sou meio que um parasita de brood quando se trata de programação e aprendizado de máquina! Eu traí e encontro esses grandes modelos que fazem todo o trabalho-toda a arrecadação-e coloco em meus dados e minhas ideias, e faz coisas para mim.

Então nós vamos usar esse conceito para nossa vantagem. Na verdade, eu tenho sido capaz de ensinar ao meu pai a maioria desses modelos que, novamente, estão prontamente disponíveis para você hoje dentro de uma ferramenta chamada Colab. Deixe-me apenas caminhar você através do que isso parece.  

Modelos para você começar

imagem01-10-2020-05-10-55

Então, para começar, se você quiser começar a se aquecer agora mesmo, basta começar a praticar segurando” Shift “e depois pressionar” Enter “.

Basta começar a praticar isso agora mesmo. É metade da batalha. Você está prestes a disparar alguns modelos realmente legais.  

imagem01-10-2020-05-10-55

Tudo certo. Quais são alguns exemplos disso? O que é que isso parece? Por isso, alguns dos modelos que você pode jogar com hoje são coisas como DeOlcodificar, que é onde você conserta e colorem fotos antigas. É realmente, muito divertido.  

Outro é um gerador de texto. Criei um com GTP-2-super bobinho, é este gerador de desculpa. Você pode manipulá-lo e fazê-lo fazer coisas diferentes para você.  

Há também um modelo de previsão realmente, realmente grande, em que você basicamente coloca um pedaço de dados de séries temporais e ele prevê o que o futuro pode ter em loja.   É realmente, realmente poderoso e divertido.

Você pode resumir texto, o que é realmente valioso. Pense em descrições de meta, todas essas coisas boas.  

Você também pode automatizar agrupamento de pesquisa de palavras-chave, o que eu mostro aqui em um segundo.  

Você pode fazer análise de link interno realmente poderosa, ter um notebook para isso.

Talvez uma das coisas mais poderosas seja você poder extrair entidades e categorias como o Google as percebe. É uma das minhas APIs favoritas. É através da API NLP do Google. Eu a puxo em um notebook, e você basicamente coloca as URLs que deseja extrair essas informações e você pode comparar como sua URL se compara aos concorrentes.

É realmente valioso, coisas divertidas.  

O mais importante, você não pode quebrar nada disso! 

Não se deixe intimidar por qualquer um do código. Muitos desenvolvedores experientes não sabem o que está acontecendo em alguns desses blocos de código. Está tudo bem.

Usando Colab

Nós obtemos de jogar neste ambiente. Ele está hospedado no Google Drive e, por isso, não há receio de que isso quebra qualquer coisa em seu computador ou com seus dados ou qualquer coisa. Então, vamos mergulhar. Como eu disse, isso é através de uma ferramenta gratuita chamada Colab.  

Você sabe como o Google levou o Excel e fez o Google Sheets?

Eles fizeram a mesma coisa com o que é conhecido como Jupyter Notebooks. Jupyter é instalado localmente em seu computador. É um dos ambientes de notebooks mais populares. Mas requer alguma configuração, e pode ser um tanto desajetada. Fica confuso com versões diferentes e yada, yada. O Google colocou isso na nuvem (configuração zero necessária)   e agora está chamando de Colab Notebooks. É inacreditavelmente poderoso.

Então, novamente, é de graça. Ele está disponível para você agora mesmo se você quiser abri-lo em uma nova guia. Há configuração zero. O Google também dá acesso a computação gratuita GPU e TPU, o que é ótimo. Ele tem um tempo de execução de 12 horas.  

Alguns cons é que você pode atingir limites. Então eu acertei os limites, e agora estou pagando 9,99 a por mês pela versão Pro e não tive problemas.

De novo, eu não sou afiliado a isso de qualquer maneira. Eu sou apenas super apaixonada por isso, e o fato de oferecê-lo uma versão gratuita é tão excitante. Eu já vi muitas pessoas se iniciaram nisso. Também é algo para notar que provavelmente não é tão seguro ou robusto quanto a solução Enterprise do Google. Então, se você está fazendo isso para uma grande empresa ou está ficando realmente sério sobre isso, você provavelmente deve conferir algumas outras opções. Mas se você é apenas meio de dabbling e quer explorar e se divertir, vamos manter essa festa indo.  

Usando pandas

Tudo bem. Por isso, novamente, este é um ambiente de notebook hospedado em nuvem. Então uma coisa que eu quero realmente focar aqui, porque eu acho que é a mais valiosa para SEOs, é essa biblioteca conhecida como “pandas“.

Pandas é uma biblioteca de análise de dados construída em cima de python.   Depois de executar apenas duas linhas de código, você pode fazer o upload de um arquivo CSV de seu computador local. Este exemplo bobo é um que eu realmente executei com dados do Google Search Console.

Então você executar isso em um notebook (Shift + Return). Novamente, estou compartilhando este caderno inteiro com você hoje. Então basta clicar na primeira célula de texto e começar a rodar Shift + Clique para te derrubar através do notebook.   Não é tão intimidante quanto parece.

imagem01-10-2020-05-10-56

Uma vez executado o código acima, faça o upload de seu CSV. Em seguida, uma vez que você faz o upload, você vai nomear seu quadro de dados.  

imagem01-10-2020-05-10-57

Depois de fazer o upload de seu CSV, você verá a saída que afirma seu nome CSV. Copie que exatamente como ele foi carregado e cole-o na próxima (acima da célula) para nomeá-lo.

Nesse caso, o meu era apenas “gsc-example.csv”. Novamente, uma vez que você faça o upload de seu CSV, você verá o nome na saída por baixo do ” from. google.colab Arquivos de importação ”   code cell.  

Agora, vamos executar algumas linhas simples de código para ter certeza de que seus dados estão lá dentro adequadamente.

imagem01-10-2020-05-10-58

Um primeiro cheque comum   as pessoas fazem é” df.head () “. Isso mostra as primeiras cinco linhas do seu quadro de dados. Você também pode fazer “df.tail ()”, e mostra-lhe as últimas cinco linhas do seu quadro de dados.

Você pode até mesmo colocar em um número entre os parênteses (ex. df.head (30))   para ver as primeiras 30 linhas. É que fácil!  

Agora vem as coisas realmente divertidas, e esta é apenas a ponta do iceberg.

imagem01-10-2020-05-10-00

Então você pode executar esta célula de código realmente legal aqui para criar uma tabela filtrável.  

O que há de poderoso sobre isso, especialmente com seus dados do Google Search Console, é você pode facilmente extrair e explorar palavras-chave que possuem um alto click-through taxa e um posto pobre em busca. É uma das minhas maneiras favoritas de explorar oportunidades de palavra-chave para clientes, e não poderia ser mais fácil.

Então, brinque com a visualização filtrável.

Se você está fazendo pesquisa de palavras-chave, você está tentando balde palavras-chave, você está tentando organizar tópicos, etc. mas você pode organizar mais facilmente suas palavras-chave com Pandas.

Eis como criar uma nova coluna que afirma se uma palavra-chave é ou não ‘Branded’.  

imagem01-10-2020-05-10-00

Então, para te caminhar por isso, “df [” Branded “]” cria uma nova coluna chamada “Branded”.  

Então “df.Query.str.contém (” moz|rand|ose ” )”   usa regex que rotula qualquer consulta com aquelas palavras-chave como Branded = True.  

Então agora isso faz filtragem e explorando isso muito mais rápido! Você pode até fazer isso de maneiras em que você pode criar uma tabela de quadro de dados totalmente diferente (exemplos disso também estão neste notebook).  

Você pode usar isso e exportar suas palavras-chave em baldes como esse, e não há tempo de stall. As coisas não congelam como o Excel. Você pode contabilar erros de misspellings e todo tipo de coisa boa mais facilmente com expressões regulares. É super legal.

Conclusão

De novo, esta é apenas a ponta do iceberg, meus amigos. Eu estou mais animado para plantar essa semente dentro de todos vocês para que vocês possam voltar e me ensinar o que vocês conseguiram realizar. Acho que temos muito mais a explorar neste espaço. Vai ser muito divertido! Se você conseguir um chute de fora disso e quiser continuar explorando diferentes modelos, programas diferentes dentro do Colab, eu altamente sugiro que você faça o download da extensão Colab Chrome.

Apenas torna a abertura do notebook muito mais fácil.  

Você pode salvar copys de notebooks que você descobre ao seu drive e brincar com isso tudo o que você quer. É muito divertido. Espero que isso tenha provocado alguma inspiração em você, e eu estou tão animada para ouvir o que todos vocês pensam e criam. -Realmente aprecia você assistindo.

Então muito obrigado. Eu te vejo a todos da próxima vez. Bye.

Transcrição de vídeo por Speechpad.com

Pronta para mais?

Você irá descobrir ainda mais bondade SEO no pacote de vídeos MozCon 2020. No preço baixo especial deste ano de $129, este é um conteúdo inestimável você pode acessar de novo e novamente durante todo o ano para inspirar e incendiar sua estratégia de SEO:

  • 21 vídeos completos de algumas das mentes mais brilhantes em marketing digital
  • Instant downloads e streaming para o seu computador, tablet ou dispositivo móvel
  • Decks deslizante de slides para apresentações

Obtenha meu pacote de vídeo MozCon 2020

Fonte: moz.com/blog/accessible-machine-learning-seo