Releases: basedosdados/sdk
Releases · basedosdados/sdk
v1.6.2
Changelog
- inclusão do parâmetro
dataset_is_public
#1020 - datasets
*_staging
agora sãoprivados por default
#1020 - parâmetro
location
define localização da criação dataset #1020 - retry de 10x ao fazer upload para o Storage #1020
- small path fix to dataset_config.yaml #1067
- criamos campos novos (e.g.
observation_level
,short_description
, etc), matamos campos (e.g.entity
,time_unit
, etc). #1093 - fizemos o campo
dataset_id
não ser automaticamente criado emdataset_config.yaml
. #1093 - o parametro
columns_config_url
viroucolumns_config_url_or_path
e agora suporta carregamento de tabela de arquitetura local - fix empity list as partition
- Redireciona metadados para ckan + adicionar função de search #1063
- Adiciona logs nas funcões de upload #1085
- Adiciona configs gerais do basedosdados #1085
- Adiciona suporte a Avro e Parquet (cont.) #1145
v1.6.1
v1.6.0
Pre-release: v1.6.0-beta
Essa pre-release compreende a implementação dos PRs #675, #795 e #847.
As mudanças proveniente de cada um dos PRs são descritas a seguir.
Changelog
PR #675
Adiciona módulo metadata.py
com as modificações e funções descritas a seguir.
Elas estão disponíveis tanto a partir da importação do módulo e da classe Metadata
via script ou notebook, tanto como a partir do cliente CLI basedosdados
.
Baixar metadados do CKAN e converter para YAML: Metadata.create
- Permite baixar metadados de um dataset/tabela do CKAN, construindo um
dataset/table_config.yaml
a partir deles - Permite criar um arquivo
dataset/table_config.yaml
estruturado e sem valores preenchidos para novos datasets e tabelas
Garantir que usuário não esteja subindo metadados mais antigos do que os atuais: Metadata.is_updated
- Permite comparar a versão do YAML local com a versão dos metadados do CKAN, indicando se os metadados locais correspondem à versão mais atualizada.
Validar se metadado está dentro dos padrões: Metadata.validate
- Indica, a partir das APIs do CKAN, quais campos do YAML estão preenchidos de forma inadequada.
- Indica o padrão correto a ser seguido no preenchimento dos dados.
Subir metadado para o CKAN: Metadata.publish
- Permite subir os metadados locais preenchidos no YAML para o CKAN.
Integração com Table
Table.create
usaMetadata.create
para gerar odataset/table_config.yaml
PR #795
- Upload para o Google Storage permite novos
modes
:header
,auxiliary_files
earchitecture
- Agora
table_approve.py
faz o download das 20 primeiras linhas da table e adiciona na pastaheader
do Google Storage
PR #847
- Introduz o parâmetro
use_bqstorage_api
nas funções de requisição de dados para acelerar o download
v1.5.7
Resolve PR #793
Breve descrição das alterações
Modificações baseadas em https://stackoverflow.com/questions/45300037/cannot-upload-large-file-to-google-cloud-storage
- Adiciona o parâmetro chunk_size como opcional em Storage.upload
- Caso ele seja configurado, altera o chunk size do blob para o valor determinado
- Caso não seja configurado, não altera o atributo do blob
- Adiciona o parâmetro chunk_size como opcional em Table.append
- Para usá-lo associado ao Storage.upload
v1.5.6
v1.5.5
v1.5.4
v1.5.3
v1.5.0
- Adiciona nova função Storage.download()
- Remove parâmetro
partitioned
do Table.create(): checa automaticamente se o dado é particionado - Resolve issue #302 : Table.update(mode="all") não sobrescreve configurações de partição
- Resolve issue #371: resolve erro de
timeout
ao tentar ler uma tabela do BigQuery - Resolve issue #294: adiciona suporte para criar colunas extras no publish.sql
v1.4.10
- Fix Storage.copy_table() prefix
- Fix Storage.delete_table()
- Auto divide batch requests in Storage.copy_table() and Storage.delete_table()
- Fix table.publish(): return error if view can't be created