Tensorflow变换字符串张量的每个元素

def expand_meta(meta): expanded_subparts = [] meta_parts = set([x for x in meta.split(',') if x != 'blah']) for part in meta_parts: subparts = part.split('.') for i in range(len(subparts)+1): expanded = '.'.join(subparts[:i]) if expanded: expanded_subparts.append(expanded) return list(set(expanded_subparts))

1条回答

网友

1楼 · 发布于 2024-09-28 22:22:35

我想这正是你想要的：

import tensorflow as tf

# Function to process a single string
def make_splits(s):
    s = tf.convert_to_tensor(s)
    # Split by comma
    split1 = tf.strings.split([s], ',').values
    # Remove blahs
    split1 = tf.boolean_mask(split1, tf.not_equal(split1, 'blah'))
    # Split by period
    split2 = tf.string_split(split1, '.')
    # Get dense split tensor
    split2_dense = tf.sparse.to_dense(split2, default_value='')
    # Accummulated concatenations
    concats = tf.scan(lambda a, b: tf.string_join([a, b], '.'),
                      tf.transpose(split2_dense))
    # Get relevant concatenations
    out = tf.gather_nd(tf.transpose(concats), split2.indices)
    # Remove duplicates
    return tf.unique(out)[0]

# Test
with tf.Graph().as_default(), tf.Session() as sess:
    # Individual examples
    print(make_splits('com.abc.display,com.abc.backend,com.xyz.forte,blah').eval())
    # [b'com' b'com.abc' b'com.abc.display' b'com.abc.backend' b'com.xyz'
    #  b'com.xyz.forte']
    print(make_splits('com.pqr,npr.goog').eval())
    # [b'com' b'com.pqr' b'npr' b'npr.goog']

    # Apply to multiple strings with a loop
    data = tf.constant([
        'com.abc.display,com.abc.backend,com.xyz.forte,blah',
        'com.pqr,npr.goog'])
    ta = tf.TensorArray(size=data.shape[0], dtype=tf.string,
                        infer_shape=False, element_shape=[None])
    _, ta = tf.while_loop(
        lambda i, ta: i < tf.shape(data)[0],
        lambda i, ta: (i + 1, ta.write(i, make_splits(data[i]))),
        [0, ta])
    out = ta.concat()
    print(out.eval())
    # [b'com' b'com.abc' b'com.abc.display' b'com.abc.backend' b'com.xyz'
    #  b'com.xyz.forte' b'com' b'com.pqr' b'npr' b'npr.goog']

我不确定您是否希望总结果像那样串联起来，或者您希望将tf.unique应用于全局结果，但在任何情况下，想法都是一样的

相关问题更多 >

编程相关推荐

热门问题

热门文章

Tensorflow变换字符串张量的每个元素

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >