尝试在Python中解压/解码专有数据文件

1条回答

网友

1楼 · 发布于 2024-09-29 19:18:45

您的文件不包含ascii字符，但被打开它的应用程序解释为ascii字符。如果你在wordpad中打开一个.jpg图像，也会发生同样的事情——你会得到一堆二进制和一些ascii字符，这些字符可以打印出来，并且可以被人眼识别。在

例如，这就是为什么不能对时间戳进行纯文本搜索的原因。在

下面是一个代码示例来演示这个问题。在二进制文件中，有以下字节：

\x44\x69\x62\x65\x6e\x7a\x6f\x79\x6c\x70\x65\x72\x6f\x78\x69\x64\x20\x31\
x32\x30\x20\x43\x20\x30\x33\x2e\x30\x35\x2e\x31\x39\x39\x34\x20\x31\x34\x3a\x32\
x34\x3a\x33\x30

如果要在像写字板这样的文本编辑器中打开它，它将呈现以下内容：

^{pr2}$

下面是Python中的代码片段：

>>> c='\x44\x69\x62\x65\x6e\x7a\x6f\x79\x6c\x70\x65\x72\x6f\x78\x69\x64\x20\x31\
x32\x30\x20\x43\x20\x30\x33\x2e\x30\x35\x2e\x31\x39\x39\x34\x20\x31\x34\x3a\x32\
x34\x3a\x33\x30'
>>> print c
Dibenzoylperoxid 120 C 03.05.1994 14:24:30

这些字节是十六进制格式，这就是为什么你不能用明文搜索它。在

这是因为二进制文件遵循一个非常特殊的结构（协议、规范），所以读取它的程序可以正确地解析它。如果您以一个jpeg图像为例，您会发现图像的第一个字节和最后一个字节总是相同的（取决于所使用的格式）-FF D8将是jpeg的前两个字节，FF D9将是jpeg的最后两个字节来标识它。一个图像编辑程序现在知道要开始将这些二进制数据解析为jpeg，它将“遍历”文件中的结构以呈现图像。Here是一个指向资源的链接，它可以帮助您根据“签名”或“头”标识文件，文件的前两个字节10 00不会出现在该数据库中，因此您可能处理的是一种专有格式，因此您无法很容易地在线找到规范。这就是逆向工程派上用场的地方。在

我建议你用一个十六进制编辑器打开你的文件-它将提供十六进制输出和ascii输出，这样你就可以开始分析文件格式了。我个人使用Hackman Hexeditor发现here（它是免费的，有很多特性）。在

但是现在-给你一些有用的东西来搜索你感兴趣的数据，这是一个快速的方法，在开始搜索之前把你的搜索查询转换成二进制。在

import struct

#binary_data = open("your_binary_file.bin","rb").read()

#your binary data would show up as a big string like this one when you .read()
binary_data = '\x44\x69\x62\x65\x6e\x7a\x6f\x79\x6c\x70\x65\x72\x6f\x78\x69\x64\x20\x31\
x32\x30\x20\x43\x20\x30\x33\x2e\x30\x35\x2e\x31\x39\x39\x34\x20\x31\x34\x3a\x32\
x34\x3a\x33\x30'

def search(text):

    #convert the text to binary first
    s = ""

    for c in text:
        s+=struct.pack("b", ord(c))

    results = binary_data.find(s)
    if results == -1:
        print "no results found"
    else:
        print "the string [%s] is found at position %s in the binary data"%(text, results)

search("Dibenzoylperoxid")

search("03.05.1994")

上述脚本的结果是：

the string [Dibenzoylperoxid] is found at position 0 in the binary data
the string [03.05.1994] is found at position 25 in the binary data

这应该能让你开始。在

相关问题更多 >

编程相关推荐

热门问题

热门文章