为什么在批处理写入DynamoDB时有时会收到“item size exceeded”消息？

mStr = json.dumps(m,encoding='utf-8', ensure_ascii=False, sort_keys=True) lStr = len(mStr) if lStr > maxlen: np = int(math.ceil(float(lStr)/maxlen)) log.info("Splitting message with id=%s of len=%d into %d pieces of upto %d" % (eId, lStr, np, maxlen)) start=0 parentMessage = "" for ip in range(np): fin=(ip+1)*maxlen ss = mStr[start:fin] eId_ss = eId + ("-part%dof%d" % (ip+1, np)) item_data = {"split" : "0", "message" : ss} item = createNewItem(table,eId_ss,item_data) csP = cPickle.dumps(item) szP = sys.getsizeof(csP) log.info("%s: [%d : %d] = %d chars, item size %d" % (eId_ss,start,fin,len(ss),szP)) items.append(item) item_eIds.append(eId_ss) parentMessage += (eId_ss + ";") start=fin item_data = {"split" : "1", "message" : parentMessage} item = createNewItem(table,eId,item_data) items.append(item) item_eIds.append(eId) else:

2条回答

网友

1楼 · 编辑于 2024-10-01 13:39:38

计算的长度实际上是字符串中的字符数。因为您使用的是UTF-8，所以一个字符最多可以有4个字节长（这就是为什么您有时会看到比预期大4倍的消息）

如果您想用Python检查字节大小，可以使用：len(mStr.encode('utf-8'))

网友

2楼 · 编辑于 2024-10-01 13:39:38

你必须重新组织数据。Dynamo DB的项目限制为64KB—这还包括属性等，因此有效大小甚至更小。在

DynamoDB-Amazon DynamoDB中的极限：http://docs.aws.amazon.com/amazondynamodb/latest/developerguide/Limits.html

这说明了如何重新构造数据以在这些限制内工作（如gzip等）

使用项目指南-Amazon DynamoDB:http://docs.aws.amazon.com/amazondynamodb/latest/developerguide/GuidelinesForItems.html

相关问题更多 >

编程相关推荐

热门问题

热门文章