Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

listando e baixando arquivos do drive #1

Open
wants to merge 4 commits into
base: main
Choose a base branch
from

Conversation

joellensilva
Copy link
Collaborator

@joellensilva joellensilva commented Sep 24, 2024

  • este "coletor" possui 2 funções:

    • listar todas as planilhas que foram baixadas e armazenadas no drive, incluindo a data (manual e periodicamente)
    • no momento do processamento dos dados, acessar essa lista, verificar se as planilhas para o órgão/mês/ano requisitado existe e, se sim, baixar as planilhas para serem processadas (a cada coleta/processamento dos dados)
  • O script faz uso de um json (credentials.json), que contém os dados da conta de serviço, não presente aqui porque é privado.

  • A variável de ambiente requisitada, FILE_ID, será passada pelo próprio executor-automatizado no processamento dos dados.

  • O script list_drive_files.py NÃO será executado no processamento dos dados, uma vez criada a lista, o script será executado periodicamente, conforme adição de novos dados no drive.

STATUS_DATA_UNAVAILABLE = 4

# Caminho para o arquivo JSON da conta de serviço
SERVICE_ACCOUNT_FILE = "credentials.json"

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Esse arquivo vai ficar onde onde?

Perguntando pois, ao invés de um arquivo local, podemos transformar ele em um segredo enviado via variável de ambiente. Se a API exigir que ele seja um arquivo a gente deve persistir em um arquivo o conteúdo da veriável.

Isso evita que arquivos com credenciais fiquem armazenados em máquinas locais.

Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

conversei com a @joellensilva e ela sugeriu criar uma autorização/token no próprio github. Eu não sei dizer qual é a melhor solução para usar essas credenciais, mas guardei os arquivos credentials.json e .env no cofre da TB se precisarem fazer um backup - esses dados ficarão guardados em segurança e poderão ser recuperados a qualquer momento.

@rdurl0
Copy link

rdurl0 commented Jan 7, 2025

Incluir o texto de PR no README.md

Copy link

@rdurl0 rdurl0 left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Faltou só o README, acho que a descrição que @joellensilva usou no PR pode ser usada nele.
Ótimo trabalho, Jo! 🥇

@danielfireman
Copy link

Além do README que o @rdurl0 mencionou, estou com outra dúvida:

O script faz uso de um json (credentials.json), que contém os dados da conta de serviço, não presente aqui porque é privado.

O arquivo é privado? Se é privado ele vem de onde e como? Por que não usar a abordagem de tê-lo como secret e materializar o conteúdo do secret em um arquivo durante o uso. A vantagem dessa abordagem é que a dependência exigida pelo estágio fica clara e coerente com as dependências de outros estágios.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

3 participants