如何获得预训练模型的拥抱脸大小？

1条回答

网友

1楼 · 发布于 2024-09-30 16:34:01

如果您面临CUDA out of memory错误，问题主要不是模型，而是训练数据。您可以减少batch_size（并行使用的训练示例的数量），因此您的gpu只需要在每次迭代中处理几个示例，而不需要处理大量示例

但是，对于你的问题：

我推荐你。它是一个计算“真实”大小（也称为“深度”大小）的库。因此，一个简单的解决方案是：

import objsize
objsize.get_deep_size(model)

然而，文件说：

Excluding non-exclusive objects. That is, objects that are also referenced from somewhere else in the program. This is true for calculating the object's deep size and for traversing its descendants.

这应该不是问题，但是如果它对于您的模型仍然太小，您可以使用Pympler，这是另一个通过递归计算“深度”大小的库

另一种方法是自己实现get_deep_size()函数，例如从this article：

import sys

def get_size(obj, seen=None):
    """Recursively finds size of objects"""
    size = sys.getsizeof(obj)
    if seen is None:
        seen = set()
    obj_id = id(obj)
    if obj_id in seen:
        return 0
    # Important mark as seen *before* entering recursion to gracefully handle
    # self-referential objects
    seen.add(obj_id)
    if isinstance(obj, dict):
        size += sum([get_size(v, seen) for v in obj.values()])
        size += sum([get_size(k, seen) for k in obj.keys()])
    elif hasattr(obj, '__dict__'):
        size += get_size(obj.__dict__, seen)
    elif hasattr(obj, '__iter__') and not isinstance(obj, (str, bytes, bytearray)):
        size += sum([get_size(i, seen) for i in obj])
    return size

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何获得预训练模型的拥抱脸大小？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >