- Linguagem principal: Python
- Framework Principal: Scrapy
- Estado atual: Trabalhando remoto lá fora
- IDE: VSCode
- OS: Ubuntão da massa / WSL2
Na real, o único jeito de haver uma migração em massa é a implosão da moderação atual do r/Brasil resultando na completa bostificação do ambiente, em conjunto com a recomendação daqui e com um jeito simples de explicar num tutorial bem interativo como funciona o bicho aqui.
Mas isso não é bom: muita gente ao mesmo tempo vai ferrar a infra do servidor e vai deixar um gosto ruim na boca do imigrante. É mais jogo deixar o negócio crescendo naturalmente.
É uma certeza de 100% que o Meta vai sugar os dados de todas as instâncias federadas a ela. Mesmo que a gente não tenha dado o nosso consentimento expresso a isso, eles tem acesso a todos os posts que quiserem pelos protocolos de federação…
Não que isso seja uma barreira grande, qualquer um pode fazer a raspagem de uma instância Lemmy… Mas creio que seja um argumento mais ético do que qualquer outra coisa.
Trabalho com Web Scraping e posso garantir que absolutamente tudo que você posta na Internet está sendo absorvido por alguma empresa por aí. Dá pra arrancar seus dados de uma empresa ou outra pelo GDPR ou adjacentes, mas não dá pra garantir que outras pessoas não tenham isso tudo guardado em algum outro lugar. Provavelmente tem instância aí que serve de front pra sugar posts de outras instâncias e fazer um bom banco de dados pra LLMs.
Eu tava achando que era algo da minha cabeça. O povo tá doido no volante, parece que piorou muito esse ano.