java使用TCP/IP拦截http文件上载
我已经为我的tomcat编写了一个拦截http请求的代理
每个请求都会经过我的代理并在到达tomcat服务器之前进行一些检查。我使用java编写的TCP/IP绑定端口
除了文件上传(多部分POST表单)提交之外,所有请求(GET和POST)都能成功路由到tomcat服务器
尽管我能够获取TCP/IP中的所有字节,并能够将数据刷新回tomcat服务器,但不知何故,数据被截断/丢失了
有没有什么特别的东西,比如编码等等。。我在处理文件流内容时需要做什么
下面是我的示例代码
protected void processData(InputStream input, OutputStream output) throws IOException
{
// reads a line of text from an InputStream
StringBuffer data = new StringBuffer("");
StringBuffer data2 = new StringBuffer("");
StringBuffer data3 = new StringBuffer("");
StringBuffer data4 = new StringBuffer("");
int c;
try
{
while ((c = input.read()) >= 0)
{
data.append((char) c);
// check for an end-of-line character
if ((c == 0) || (c == 10) || (c == 13))
{
output.write(data.toString().getBytes(), 0, data.length());
data4.append(data.toString());
data = new StringBuffer();
count = 0;
}
else
{
if (count > 6)
{
if (input.available() == 1)
{
data.append((char) input.read());
}
data2.append(data.toString());
data4.append(data.toString());
output.write(data.toString().getBytes(), 0, data
.toString().length());
data = new StringBuffer();
}
else
{
if (count == 6)
{
if (data.toString().toLowerCase()
.indexOf("get /") == 0
|| data.toString().toLowerCase()
.indexOf("post /") == 0)
{
count = 0;
contentLength = -1;
// continue read data(header info)
while ((line = readLine(input, data)) != null)
{
data = new StringBuffer();
// do my own stuff here dealing with headers
if (StringUtils.isBlank(line))
{
data4.append(line);
output.write(line.getBytes(), 0,
line.length());
break;
}
line += "\r\n";
output.write(line.getBytes(), 0,
line.length());
data4.append(line);
output.flush();
}
}
else
{
if (input.available() == 1)
{
data.append((char) input.read());
}
}
}
else
{
if (input.available() == 1)
{
data.append((char) input.read());
output.write(data.toString().getBytes(), 0,
data.toString().length());
data4.append(data.toString());
data3.append(data.toString());
data = new StringBuffer();
}
}
}
count++;
}
if (processbody)
total++;
if (contentLength > 0 && contentLength == total)
{
log.debug("post data2: "
+ (data2.toString() != null ? data2.toString() : " "));
log.debug("post data3: "
+ (data3.toString() != null ? data3.toString() : " "));
log.debug("post data4: "
+ (data4.toString() != null ? data4.toString() : " "));
output.flush();
}
}
}
catch (Exception e)
{
log.error("Error ", e);
}
finally
{
}
}
# 1 楼答案
您的代码中有一些缺陷:
从
InputStream
中读取每个byte
,然后将其转换为char
并将其附加到字符串生成器。如果流是编码字符,例如汉语、希腊语或任何特殊字符,则无法将流正确解码为可读字符串。或者,如果流是纯二进制或ascii,字符串不是存储流的最佳方式。当您提交文件多部分请求时,这很容易发生我不是并发方面的专家(所以我可能在这里说的是无意义的),但如果同时出现多个连接,会发生什么呢。你应该小心点
在我看来,您需要处理http请求的头,因此没有理由不使用Alexey Sviridov建议的servlet过滤器。您可以实现自己的过滤器来截取标题并对其进行处理。使用过滤器的好处是,您可以让servlet API为您解析请求的头,而无需担心何时读取/写入输入/输出流
但是,如果您打算截取请求的头部,并决定是否应该将请求传递到tomcat或servlet容器,或者执行任何不在servlet能力范围内的操作,那么您应该查看http代理库。下面是一个例子:
http://proxies.xhaus.com/java/
前面有一个关于writting HTTP Proxy in Java关于堆栈溢出的问题
遗憾的是,我不想鼓励您编写自己的http代理。你要考虑的问题太多了