我正在开发一个数据可视化仪表板在Tableau与数以百计的CSV文件在AWS S3桶,每天都会产生新的文件。 为了实现这一点并加快进程,我将文件加载到AWS Redshift DB中。CSV文件有新的列,有时以前存在的列不会出现在传入的文件中。为了处理这个问题,我修改了我的代码来读取和比较标题,如果有新的标题出现,它将改变表,添加新的列。你知道吗
然而,我面临的问题是:
'cost'
,则在下个月'cost'
列可能不存在,但它会按值'Blended Cost'
映射到一个新列。你知道吗处理这种情况最好的方法是什么?如有任何推荐,我们将不胜感激。你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐