合并两个几乎相同的字符串问题的回答

合并两个几乎相同的字符串

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我有两个对象，一个是带有<code>(int, str)</code>的元组列表，如下所示： <pre><code>first_input = [ (0 , "Lorem ipsum dolor sit amet, consectetur"), (1 , " adipiscing elit"), (0 , ". In pellentesque\npharetra ex, at varius sem suscipit ac. "), (-1 , "Suspendisse luctus\ncondimentum velit a laoreet. "), (0 , "Donec dolor urna, tempus sed nulla vitae, dignissim varius neque.") ] # Note that the strings contain newlines `\n` on purpose. </code></pre> 另一个对象是字符串，它是一系列操作（*）的结果，通过设计，这些操作将导致上面所有字符串的串联，但会插入一些额外的换行符<code>\n</code> （*：显然，在保存<code>list of tuples</code>结构时无法做到这一点） 例如： <pre><code>second_input = "Lorem ipsum dolor sit amet,\nconsectetur adipiscing elit. In pellentesque\npharetra ex, at varius sem\nsuscipit ac. Suspendisse luctus\ncondimentum velit a laoreet. Donec dolor urna, tempus sed\nnulla vitae, dignissim varius neque." # Note that there are 3 new newlines, here ^ for instance # but also in "sem\nsuscipit" and "sed\nnulla" </code></pre> 我的目标是回到第一个结构，但保留额外的换行符。在我的例子中，我会得到： <pre><code>expected_output = [ (0 , "Lorem ipsum dolor sit amet,\nconsectetur"), # new newline here (1 , " adipiscing elit"), (0 , ". In pellentesque\npharetra ex, at varius sem\nsuscipit ac. "), # new newline here (-1 , "Suspendisse luctus\ncondimentum velit a laoreet. "), (0 , "Donec dolor urna, tempus sed\nnulla vitae, dignissim varius neque.") # new newline here ] </code></pre> 除了通过逐个字符的比较来重建字符串之外，您还有其他聪明的方法吗 （注意：如果一个新的<code>\n</code>处于字符串的极限，我不在乎它在两个元组中的哪一个结束。例如，获取<code>[(0, "foo\n"), (1, "bar")]</code>或<code>[(0, "foo"), (1, "\nbar")]</code>并不重要。） <hr/> 编辑：我想避免的是这样做： <pre><code>position=0 output = [] for tup in first_input: reconstructed_string = "" for letter in tup[1]: if letter == second_input[position]: reconstructed_string = reconstructed_string + letter else: reconstructed_string = reconstructed_string + second_input[position] position +=1 output.append((tup[0], reconstructed_string)) # Note: this is hastily written to give you an idea, I have no idea if it would work properly, probably not # Well, it does seem to work without bug, at least in my example. That's unexpected lol. Anyway, if you can think of a better solution...! </code></pre> 也就是说，遍历字符串的每个字符并比较它们以逐个字符地重建字符串

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

好的，考虑到没有字符被替换或修改（如OP所述），我可以得出以下结论： <pre class="lang-py prettyprint-override"><code>first_input_no_newline = list(map(lambda x: (x[0], x[1].replace('\n', '')), first_input)) expected_output = [] for item in first_input_no_newline: next_index = len(item[1]) second_input_copy = second_input offset = 0 while True: amount = second_input_copy[:next_index].count("\n") if not amount: next_index += offset break offset += amount second_input_copy = second_input_copy.replace('\n', '', amount) expected_output.append((item[0], second_input[:next_index])) second_input = second_input[next_index:] print(expected_output) </code></pre> 解释：你不必跟踪新线或类似的东西。此外，“first_input”中的换行符并不重要，因为我们在第二个输入中有所有换行符（加上更多换行符） 因此，只需获取<code>first_input_no_newline</code>的每个项目的长度，如果其中没有换行符，这也应该是<code>second_input</code>中的子字符串的长度，但是，如果有换行符，好的，只需继续计数并从第二个\u输入的副本中删除它们，并将此结果作为偏移量添加到原始第二个\u输入 输入示例（修复了OP的原始输入，在某些短语之间添加缺少的白色字符）： <pre class="lang-py prettyprint-override"><code>first_input = [ (0, "Lorem ipsum dolor sit amet, consectetur"), (1, " adipiscing elit"), (0, ". In pellentesque\npharetra ex, at varius sem suscipit ac. "), (-1, "Suspendisse luctus\ncondimentum velit a laoreet. "), (0, "Donec dolor urna, tempus sed nulla vitae, dignissim varius neque.") ] second_input = "Lorem ipsum dolor sit amet, \nconsectetur adipiscing elit. In pellentesque\npharetra ex, at varius sem \nsuscipit ac. Suspendisse luctus\ncondimentum velit a laoreet. Donec dolor urna, tempus sed \nnulla vitae, dignissim varius neque." </code></pre> 输出： <pre class="lang-py prettyprint-override"><code>[ (0, 'Lorem ipsum dolor sit amet, \nconsectetur'), (1, ' adipiscing elit'), (0, '. In pellentesque\npharetra ex, at varius sem \nsuscipit ac. '), (-1, 'Suspendisse luctus\ncondimentum velit a laoreet. '), (0, 'Donec dolor urna, tempus sed \nnulla vitae, dignissim varius neque.') ] </code></pre>

合并两个几乎相同的字符串

1 个回答

相关Python问题