将文本行更改为二进制类型模式

3条回答

网友

1楼 · 编辑于 2024-05-20 13:42:43

此处：

wordlist = [':)', ':(', 'happy', 'sad']
tweets = ['I find python cool, it makes me happy :)', 'today is a sad day :(']
for tweet in tweets:
    print(' '.join(['1' if word in tweet else '0' for word in wordlist]))

输出：

1 0 1 0
0 1 0 1

网友

2楼 · 编辑于 2024-05-20 13:42:43

说明

我建议把它作为一个函数运行。但是首先您需要创建一个哈希表，其中键是您想要匹配的单词，值都是0。然后在函数中使用该正则表达式来查找匹配的单词，并在所有匹配项上将该匹配项的哈希表值更新为1。完成后，可以将哈希表的值连接到一个字符串中

(?<=^|\s)(\b(?:happy|kittens|[:][)])\b)\W?(?=\s|$)

enter image description here

(?<=^|\s)向后看以确保单词有空格或字符串开头
(启动捕获组1
\b使用单词边界
(?:启动非捕获组
happy|kittens|[:][)]分别匹配单词happy、kittens或：）
)关闭非捕获组
\b使用单词边界
)关闭捕获组1
\W?捕获任何额外的非空白字符，这会吃掉一个标点符号，可能没用，但允许额外的检查
(?=\s|$)要求单词的末尾有空格或字符串结尾

示例

我不懂python，下面是我如何在Powershell中实现它的示例，说明了如何使用逻辑来显示正则表达式。你知道吗

$Words = @("happy", "kittens", "[:][)]")
$Tweet = "I really like kittens, they make me happy."

# build hashtable for each word
[hashtable]$WordHash = @{}
foreach ($Word in $Words) {
    $WordHash[$Word] = "0"
    } # next word

# find each known word and document find it
$Regex = "(?<=^|\s)(\b(?:" + $($Words -join "|") + ")\b)\W?(?=\s|$)"
Write-Host "regex:  $Regex"
    ([regex]$Regex).matches($Tweet) | foreach {
        $WordHash[$_.Groups[1].Value] = "1"
        } # next match

$WordHash[$Words] -join " "

yields
regex:  (?<=^|\s)(\b(?:happy|kittens|[:][)])\b)\W?(?=\s|$)
1 1 0

网友

3楼 · 编辑于 2024-05-20 13:42:43

说明

如果一定要用正则表达式，我会分两部分来做。你知道吗

第1部分将查找所有已知单词并用1替换。将已知的word文件读入数组，然后用regex或符号|加入数组。然后将该字符串嵌套到正则表达式中。你知道吗

(?<=^|\s)(\b(?:happy|kittens|[:][)])\b\W?)(?=\s|$)

第2部分返回并用0替换所有非1。你知道吗

(?<=^|\s)\b(1[^\s]+|[^1]|[^\s]{2,})\b(?=\s|$)

示例

我不知道python，但下面是一个php示例，说明它的外观。你知道吗

<?php
$sourcestring="I really like kittens, they make me happy.";
echo preg_replace('/(?<=^|\s)(\b(?:happy|kittens|[:][)])\b\W?)(?=\s|$)/i',' 1 ',$sourcestring);
?>

$sourcestring after replacement:
I really like 1 they make me 1



<?php
$sourcestring="I really like 1 they make me 1";
echo preg_replace('/(?<=^|\s)\b(1[^\s]+|[^1]|[^\s]{2,})\b(?=\s|$)/im',' 0 ',$sourcestring);
?>

$sourcestring after replacement:
0 0 0 1 0 0 0 1

摘要

第1部分
- (?<=^|\s)向后看以确保单词有空格或字符串开头
- (启动捕获组1
- \b使用单词边界
- (?:启动非捕获组
- happy|kittens|[:][)]分别匹配单词happy、kittens或：）
- )关闭非捕获组
- \b使用单词边界
- \W?捕获任何额外的非空白字符，这会吃掉一个标点符号
- )关闭捕获组1
- (?=\s|$)要求单词的末尾有空格或字符串结尾
第2部分
- (?<=^|\s)向后看以确保单词有空格或字符串开头
- \b使用单词边界
- (启动捕获组1
- 1[^\s]+使用1后跟任意数量的非空白字符，这可防止先前匹配/替换的1被选取
- |或
- [^1]使用单个字符，前提是它不是1
- |或
- [^\s]{2,}2个或更多非空白字符
- )关闭捕获组1
- \b使用单词边界
- (?=\s|$)要求单词的末尾有空格或字符串结尾

免责声明

如果输入字符串包含1，并且1不是输入字符串的一部分，则此解决方案可能会失败。您可能需要考虑对分隔的空白进行拆分，然后对返回的数组应用逻辑。你知道吗

说明

示例

说明

示例

摘要

免责声明

相关问题更多 >

编程相关推荐

热门问题

热门文章