擅长:python、mysql、java
<p>不确定您将使用哪种语言执行此操作,但此regex在PHP中工作时<a href="http://www.regular-expressions.info/unicode.html#category" rel="nofollow">using predefined Unicode scripts</a>:</p>
<pre><code>/(?:[\p{Han}0-9]+)/simu
</code></pre>
<p>同样,这可能更易于移植,因为并非所有regex实现都设置了预定义的Unicode脚本:</p>
^{pr2}$
<p>下面是一些在两个regex都已就绪的测试代码;注释其中一个或另一个以进行测试:</p>
<pre><code>// Set the test string.
$string = '摄氏零下253';
// Run it through preg_match.
// $regex = "/(?:[\p{Han}0-9]+)/simu";
$regex = "/[\x{4e00}-\x{9fa5}0-9]+/simu";
preg_match($regex, $string, $matches);
// Send a UTF-8 header out so it looks nice.
header('Content-Type: text/html; charset=UTF-8');
// Dump the matches.
echo '<pre>';
print_r($matches);
echo '</pre>';
</code></pre>
<p>下面是脚本的结果:</p>
<pre><code>Array
(
[0] => 摄氏零下253
)
</code></pre>