Pandas oferece uma ferramenta amigável para filtrar, remodelar, modificar e transformar seus dados; você pode adicionar/excluir e criar linhas e colunas, assim como no Excel, e suporta diferentes tipos de dados. Requer menos codificação. Análise coletada por e hospedada no G2.com.
Pandas têm uma curva de aprendizado muito íngreme e ficam muito complexos. À medida que você avança e se aprofunda, as coisas ficam mais difíceis de entender como essa biblioteca funciona, e também a documentação é pobre. Análise coletada por e hospedada no G2.com.
A melhor coisa sobre pandas é a compatibilidade com conjuntos de dados que você pode manipular como arquivos excel, csv, json, você também pode lidar com listas ou dataframes sqlalchemy, é muito importante essa parte dos dados com pandas se você quiser enviá-los para chamá-los em outro lugar, por exemplo, uma página da web. Análise coletada por e hospedada no G2.com.
ultimos esquemas, é difícil entendê-los porque se você converter, por exemplo, um dataframe sqlalchemy que já tem um esquema definido, o pandas ignora completamente e coloca tudo em um só, você deve defini-lo você mesmo e isso é uma tarefa tediosa, mas não impossível. Análise coletada por e hospedada no G2.com.
Eu considero o pandas o melhor dos melhores para processamento e análise de dados. Com tantas funções e métodos, o pandas permite processar e analisar dados conforme nossas necessidades. Minha parte favorita é usar groupby com função lambda para obter uma análise detalhada. Análise coletada por e hospedada no G2.com.
É difícil não gostar do pandas quando você o usa em todos os seus projetos e trabalhos com dados. Mas ainda assim, o pandas não suporta processamento paralelo tanto quanto o pyspark. Essa é uma desvantagem, mas ainda assim é mais do que benéfico. Análise coletada por e hospedada no G2.com.
Pandas é uma ótima maneira de trabalhar com dados tabulares. Eu realmente aprecio as implementações em C++ que permitem a manipulação performática de dados em Python. Existem também excelentes maneiras de visualizar os dados. Análise coletada por e hospedada no G2.com.
Eu acho que algumas das semânticas de indexação são muito confusas. As maneiras de usar .loc, [colname] são redundantes e geram avisos em algumas implementações. Eu gostaria que isso fosse mais direto. Análise coletada por e hospedada no G2.com.
Usando o Pandas, podemos facilmente manipular dados como ordenação, estruturação, mesclagem de dados, etc. Ler qualquer arquivo como csv ou outro, nesse momento, o pandas é melhor do que usar recursos de arquivo. Análise coletada por e hospedada no G2.com.
Você tem muitos dados naquela época, não é visível usar alguma função e o pandas não tem muitos gráficos de visualização, que usam outra biblioteca e não são usados para dados não estruturados. Análise coletada por e hospedada no G2.com.
Muito útil para qualquer tipo de pipeline de ciência de dados/aprendizado de máquina. Funções vetorizadas tornam a edição das tabelas muito fácil e funcionam bem com todos os tipos de dados tabulares (csv, txt, etc.). Análise coletada por e hospedada no G2.com.
Pode ter uma curva de aprendizado muito íngreme, o que significa que novos usuários têm dificuldade em acessar toda a gama de recursos oferecidos. Também pode ser difícil entender exatamente o que está acontecendo ao agrupar/filtrar. Análise coletada por e hospedada no G2.com.
Pandas é a melhor estrutura do Python que eu provavelmente uso antes do processo de aprendizado de máquina para limpeza de dados e visão geral dos dados, onde lidamos com valores nulos, tratamento de outliers e para criar dados de forma apropriada. Análise coletada por e hospedada no G2.com.
Eu não desgosto de pandas porque será fácil para nós quando fazemos pré-processamento de dados, e usamos algumas funções embutidas do pandas, tornando fácil fazer o código sem qualquer lógica manual. Análise coletada por e hospedada no G2.com.
É muito flexível no manuseio de grandes dados e oferece grande ajuda ao Analista/Cientista de Dados para realizar operações básicas do dia a dia que são mais utilizadas na indústria. Análise coletada por e hospedada no G2.com.
A documentação é boa para um entendimento básico, mas se você precisar se aprofundar, a documentação não é tão boa ou fácil de encontrar. Além disso, para dimensões mais altas, pandas não será a escolha certa e o analista/cientista de dados terá que usar outras bibliotecas. Análise coletada por e hospedada no G2.com.
O que mais gosto do framework de pandas para python é a facilidade de uso e sua grande documentação. Atualmente, sendo pandas uma extensão de numpy, tem uma das melhores documentações possíveis. Análise coletada por e hospedada no G2.com.
Ainda tendo uma boa documentação, o principal problema que o Python tem (consequentemente o pandas), é que devem melhorar a eficiência de cálculo. Às vezes costuma ser um pouco lento. Análise coletada por e hospedada no G2.com.
Pandas fornece muitos recursos pré-construídos para modificar e manipular dados, uma das bibliotecas mais usadas no espaço de ciência de dados, pandas é fácil de instalar graças ao pip (instalador de pacotes do Python). Análise coletada por e hospedada no G2.com.
Pandas é de fato uma ótima biblioteca, mas há uma curva de aprendizado que é um problema realmente grande para iniciantes, também a documentação não é bem escrita, então é difícil referir-se e trabalhar com a documentação oficial. Análise coletada por e hospedada no G2.com.