Como Scrape e-mails do LinkedIn

Como fazer, Scraping, Mar-06-20245 minutos de leitura

O LinkedIn é a plataforma de rede social perfeita para profissionais, com 660 milhões de usuários, dos 303 milhões de usuários ativos mensais. Portanto, se você ainda não criou uma conta no LinkedIn, faça isso hoje mesmo. Você pode se aproximar de gigantes do setor. Neste artigo, falaremos sobre como scrape e-mails de contas do LinkedIn. Muitas vezes você pode

O LinkedIn é a plataforma de rede social perfeita para profissionais, com 660 milhões de usuários, dos 303 milhões de usuários mensais ativos. Portanto, se você ainda não criou uma conta no LinkedIn, faça isso hoje mesmo. Você pode se aproximar de gigantes do setor.

Neste artigo, falaremos sobre como scrape e-mails de contas do LinkedIn. Muitas vezes, você pode precisar de endereços de e-mail para os processos de recrutamento que sua empresa emprega com frequência ou para campanhas publicitárias não intrusivas.

No entanto, a maioria dos usuários oculta seus endereços de e-mail por questões de privacidade. O LinkedIn também fornece mecanismos para ocultar esses endereços de e-mail da visualização pública. Portanto, em tais circunstâncias, a única maneira de acessar os endereços de e-mail é por meio do site scraping. 

Portanto, sem mais delongas, vamos descobrir como você pode enviar um e-mail para scraping com o LinkedIn. Mas, primeiro, vamos descobrir também por que você precisa usar o scrape do LinkedIn.

Por que scrape e-mails do LinkedIn?

Conforme mencionado no parágrafo introdutório, você pode precisar dele para fins de recrutamento ou marketing. Para elaborar um pouco mais, um perfil de usuário no LinkedIn tem nomes, endereços de e-mail, habilidades competentes, experiência profissional, qualificações etc. Por outro lado, os perfis de empresas têm anúncios de emprego, número de funcionários, funcionários atuais e vários outros dados vitais.

Portanto, o LinkedIn tem uma grande quantidade de informações que serão imensamente benéficas para as pessoas.

Alguns usuários podem usar bots e crawlers para scrape e-mails e criar uma lista de e-mails. Em seguida, eles vendem essas listas de e-mail para profissionais de marketing e outros grupos que têm grande interesse nesses dados.

Dito isso, você deve considerar também os aspectos éticos do e-mail scraping . Geralmente, ele é considerado antiético, mesmo que as intenções não sejam maliciosas. Entretanto, a eficácia do e-mail do LinkedIn scraping para criar relacionamentos profissionais não pode ser ignorada.

Portanto, a próxima seção se concentrará na legalidade do e-mail scraping do ponto de vista do LinkedIn com um exemplo.

O LinkedIn permite alguma forma de scraping?

A resposta é um grande não-não, para que você entenda a mensagem corretamente. A documentação do LinkedIn sobre "Software e extensões proibidos" proíbe estritamente o uso de rastreadores, bots, robôs, scripts e quaisquer outros complementos ou plug-ins para scrape o site do LinkedIn. Você pode ler mais sobre o uso de scrapes no LinkedIn no link acima para ter uma ideia do que se trata.

O LinkedIn aplicou a maioria dessas regras para proteger a privacidade de seus membros. Entretanto, há áreas cinzentas em algumas dessas leis antiscraping . Digo isso porque, há algum tempo, o LinkedIn processou 100 scrapers anônimos por scraping dados do LinkedIn, mas ainda não houve um veredicto sobre o caso. Isso também se deve ao fato de o LinkedIn não ter conseguido distinguir o bom scraping do destrutivo scraping.

O caso acima resultou no surgimento de questões críticas em scraping. Entretanto, elas estão além do escopo deste artigo. Portanto, o que estou tentando elaborar aqui é que, se você pretende scrape dados do LinkedIn, precisa estar ciente de que eles não gostam disso. Portanto, é preciso fazer isso corretamente, o que você descobrirá nas próximas seções.

Como acessar scrape e-mails do LinkedIn?

Para scrape e-mails da maneira correta, você precisa considerar vários fatores. Alguns desses fatores críticos são:

  • Você precisa de métodos manuais ou automatizados para scraping e-mails?
  • Se você for usar métodos automatizados, quais são os parâmetros do aplicativo que você definirá?
  • Que tipos de perfis e páginas você scrape do LinkedIn (perfis públicos e privados que discutiremos mais adiante)? 
  • Você usará o site proxies e, em caso afirmativo, quais são os tipos de proxies e quantos?

Portanto, na próxima seção, analisaremos o método mais seguro e legítimo de scraping endereços de e-mail do LinkedIn.

Exporte manualmente os contatos do LinkedIn.

Essa é a maneira mais segura e legítima de scrape e-mails do LinkedIn. 

Antes de instruí-lo sobre as etapas da exportação manual, uma palavra de cautela sobre esse método: há uma nova configuração de privacidade no LinkedIn que permite apenas acesso privilegiado aos IDs de e-mail de um usuário. No entanto, você pode alterar essa configuração para a opção "mais fraca". Ao fazer isso, você fica à mercê de hackers que podem usar seu endereço de e-mail para atos maliciosos.

Portanto, com esse método, você poderá baixar apenas o endereço de e-mail de seus contatos diretos. Além disso, você está limitado ao download de e-mails que alteraram a configuração de privacidade padrão para "mais fraca".

De qualquer forma, a seguir estão as etapas que você precisa seguir para baixar os e-mails manualmente:

  1. Faça login no seu perfil do LinkedIn com seu ID de e-mail e senha.
  2. Navegue até a página inicial.
  3. Em seguida, localize o ícone Eu na barra de navegação superior.
  4. Clique no ícone suspenso no ícone Eu.
  5. Selecione settings & privacy (configurações e privacidade) no menu suspenso
  6. Em seguida, clique na guia de privacidade localizada na barra lateral esquerda
  7. Clique na primeira opção, que diz "Como o LinkedIn usa seus dados".
  8. Faça login se for solicitado a fazê-lo.
  9. Em seguida, você será redirecionado para uma página de dados marcada; baixe sua opção de dados que está abaixo dela.
  10. Nessa página, você deve selecionar as conexões de destino cujo e-mail deseja direcionar.
  11. Em seguida, para finalizar, siga as instruções na tela.

Em seguida, você receberá um e-mail com um link para extrair os dados solicitados.

Uso de ferramentas automatizadas

Como você acabou de ver acima, usando o método manual, você obterá apenas alguns resultados. Portanto, você precisa usar um método alternativo na forma de ferramentas de automação. Essas ferramentas de automação são aplicativos de rastreamento destinados apenas ao LinkedIn. Vamos descobrir algumas delas.

O PhantomBuster, também chamado de raspador de perfil do LinkedIn, é um aplicativo baseado em nuvem. Os gerentes de RH e recrutadores costumam usá-lo para extrair dados valiosos, como endereços de e-mail de candidatos ou funcionários em potencial. Se os perfis-alvo forem "conexões diretas", você poderá extrair os detalhes facilmente. No entanto, para "conexões indiretas", a extração de e-mails se torna complicada. Você pode encontrar mais informações sobre essa ferramenta aqui.

Octoparse-Essa é uma ferramenta muito inteligente da Web scraping , pois usa apenas três etapas para coletar dados. Primeiro, ela encontra os dados, seleciona os dados e depois os exporta. Ela oferece várias opções para salvar os dados, seja em CSV, XLSX ou em diferentes plataformas usando a chave da API. Com ele, você pode usar os servidores proxy para mascarar seus endereços IP ou usar uma rotação automatizada de IP para evitar um banimento do LinkedIn. Leia mais para saber mais sobre o Octoparse.

SalesQL - Essa ferramenta é gratuita e é uma extensão do navegador Google Chrome. Portanto, você pode adicioná-la facilmente ao seu navegador Chrome. Os representantes de vendas e recrutadores costumam usar essa ferramenta para scrape e-mails do LinkedIn. Independentemente de a conexão ser de primeiro grau ou não, você pode extraí-la. Você pode exportar os contatos para arquivos CSV/Excel, ATS (software de RH) ou CRM. Fique à vontade para obter mais informações sobre o SalesQL aqui.

Quais são os parâmetros de aplicação para métodos automatizados?

Para scrape dados de algumas das ferramentas de raspagem acima, seria útil se você soubesse como definir esses parâmetros:

Fios

Threads são o número de conexões abertas no momento que você está usando para scrape dados do LinkedIn ou de qualquer outro site. Quanto maior o número de threads, mais rápido será o processo de scraping . No entanto, o LinkedIn o sinalizará rapidamente.  

Portanto, embora muitos scrapers definam 10 proxies por thread, a melhor opção seria usar um thread por proxy. Se for mais do que isso, o LinkedIn desconfiará que você poderá acabar entrando na justiça, mesmo que isso possa retardar o processo scraping .

Tempo limite

Os tempos limite são a quantidade de tempo que o servidor leva para responder a um proxy antes que o proxy inicie uma nova solicitação. Muitos scrapers definem os tempos limite para 1 ou 2 segundos. Isso sobrecarregaria os resultados. No entanto, não recomendamos isso e, consistentemente, você precisa definir seus tempos limite em um nível mais alto, digamos, de 20 a 30 segundos. Isso dá ao servidor uma pausa sólida antes de aceitar uma nova solicitação.

Scraping perfis privados no LinkedIn

Nesta última seção, você descobrirá como scrape um perfil privado. No entanto, scraping perfis privados para e-mails e outros detalhes levantarão questões legais para o LinkedIn. Isso ocorre porque, quando você cria uma conta no LinkedIn, o LinkedIn promete proteger seus dados e não divulgá-los a terceiros.

Você pode scrape os dados de alguém, inclusive endereços de e-mail, para fins não destrutivos. Entre eles, talvez você esteja procurando emprego e procurando redatores técnicos autônomos em uma determinada cidade. Por outro lado, você pode estar acessando scraping para pesquisa. Portanto, com isso em mente, vamos descobrir como scrape perfis privados.

Criar contas

A maneira ideal de scrape de perfis privados é criar uma conta de usuário. Assim, você poderá se conectar com o maior número possível de contatos. No entanto, seria útil se você tivesse em mente que essa conta não é para se conectar com pessoas. Em vez disso, use-a como um ponto de entrada para o LinkedIn para fins de scraping .

Recomendo o uso do Octoparse para essa finalidade. Isso porque ele permite que você faça login no LinkedIn com sua conta e aplique as pesquisas apropriadas. Em seguida, você pode scrape com o recurso de arrastar e soltar enquanto mostra a página do LinkedIn em que você está.

Busca e colheita

Depois de criar a conta e quando estiver pronto para pesquisar com o Octoparse, você precisará descobrir o que pesquisar. Em seguida, o Octoparse explorará o que você precisa com precisão. No entanto, você pode coletar apenas as informações disponíveis como uma não conexão, incluindo os endereços de e-mail dos contatos.

Usando o Dedicado proxies

É provável que o LinkedIn o bloqueie com o método acima se você não obedecer às regras de tempo limite e de tópicos.

Além disso, certifique-se de que, ao criar uma conta, use um servidor proxy e use o mesmo endereço IP ao acessar scraping por meio do Octoparse. Isso ocorre porque você aparece como um ser humano para o LinkedIn, já que a maioria dos seres humanos não acessa o LinkedIn de diferentes endereços IP em frações de segundos. Portanto, se você usar um proxy para criar uma conta, use o mesmo proxy quando scraping LinkedIn.

Agora é uma questão de saber qual proxies usar e quantos proxies usar.

Qual proxies usar para o LinkedIn scraping?

O proxies ideal para o scraping LinkedIn é o proxies de elite. Isso ocorre porque o proxies elite oferece configurações de cabeçalho mais anônimas e seguras do que os outros tipos de proxy .

Antes de scraping, você precisa estar ciente de que o LinkedIn não gosta de scraping e trata os culpados com seriedade. Isso significa que você precisa usar o Elite proxies dedicado e o Elite privado proxies. O proxies compartilhado ou gratuito está simplesmente fora da equação para essa finalidade.

Número de Proxies

O número de proxies dependerá muito do tamanho que você terá scraping. Conforme mencionado acima, ao usar um único proxy por conta, é recomendável usar 50 contas e 50 proxies.

Suponha que você queira ter mais proxies por conta, o que não recomendamos, use algo entre 100 e 150. Em seguida, alterne-as com frequência para que o LinkedIn não as pegue e as proíba.

Por outro lado, se você tiver menos proxies, o LinkedIn provavelmente as banirá. Portanto, para determinar o melhor número, você deve fazer o máximo de experiências possíveis com o LinkedIn. Isso também o ajudará a identificar se algum de seus proxies está na lista negra do LinkedIn.

Conclusão

Depois de ler este artigo, esperamos que você tenha uma ideia abrangente de como pode scrape e-mails por meio do LinkedIn. A maneira mais fácil e mais óbvia é usar o método manual. No entanto, isso não retornará um punhado de resultados. Portanto, a escolha mais óbvia seria usar uma ferramenta automatizada em conjunto com a elite proxies.

Desejamos boa sorte na extração de e-mails do LinkedIn usando os métodos mencionados aqui.