有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

这些神秘人物是什么

这可能不是一个编程问题,但我在谷歌上找不到任何答案

目前我有一些文本挖掘任务,正在进行数据清理。 我经常遇到一些不可读的神秘人物

这些字符是:&#x003b2&#x00025等等

所有这些都是从一个特定的模式开始的,因此我相信它们代表了一些Excel无法读取的编码

有什么办法可以改变他们吗?我需要知道这些字符的确切含义,以便知道是否应该删除它们


共 (2) 个答案

  1. # 1 楼答案

    这些可能是以十六进制格式编写为HTML实体的Unicode字符

    • ^{}是“希腊小写字母BETA”(β)
    • ^{}是“百分号”()
  2. # 2 楼答案

    它们看起来像格式化的十六进制值(如果使用字符,可能是unicode)。 您可能知道它们为0x003B20x00025,或者许多其他方式