在Java裏處理文件的技巧
導讀:看到太多的凌亂的,不安全的處理文件的代碼了。可以説每個項目都會有人喜歡寫自己的一些FileUitl。下面是小編為大家整理的在Java裏處理文件的技巧,歡迎參考~
實用的工具類,Path,Paths,Files,FileSystem
有一些很靈活的處理方法:
//得到一個Path對象
Path path = ("/test/");
//Path轉換File
File file = le();
AllBytes(path);
ists(path);
(path);
正確拼接路徑不要手動拼接路徑
不好的代碼:
String game = "foo";
File file = new File("~/test/" + game + "");
即使是要手動拼接路徑,請使用下面兩個平台無關的變量:
tln(Separator);
tln(rator);
正確簡潔的方法是使用Paths類:
Path path = ("~/test/", "foo", "bar", "");
tln(path);
// ~/test/foo/bar/
讀取文件的所有內容,文件的所有行
讀取文件所有內容前,先判斷文件大小,防止OOM。
public static byte[] readAllBytes(String fileName, long maxSize) throws IOException {
Path path = (fileName);
long size = (path);
if (size > maxSize) {
throw new IOException("file: " + path + ", size:" + size + "> " + maxSize);
}
return AllBytes(path);
}
public static ListreadAlllines(String fileName, Charset charset, long maxSize) throws IOException {
Path path = (fileName);
long size = (path);
if (size > maxSize) {
throw new IOException("file: " + path + ", size:" + size + "> " + maxSize);
}
return AllLines(path, charset);
}
利用JDK7的特性,auto close,遠離一堆的catch, close
Path path = ("~/test/", "foo", "bar", "");
try (InputStream in = nputStream(path)) {
// process
//();
}
歷遍目錄
DK7新特性,FileVisitor
public class MyFileVisitor extends SimpleFileVisitor{
@Override
public FileVisitResult visitFile(Path file, BasicFileAttributes attrs) throws IOException {
tln(file);
return INUE;
}
public static void main(String[] args) throws IOException {
Path path = ("/home/user/test");
FileTree(path, new MyFileVisitor());
}
}
判斷文件是否在父路徑下
網上流傳一種遞歸判斷parent的方式,
但是查閲jdk代碼後,發現getParent()函數是通過處理文件名得到的。所以直接比較文件前綴即可。
請務必注意,anonicalPath()函數 。
public static boolean isSubFile(File parent, File child) throws IOException {
return anonicalPath()tsWith(anonicalPath());
}
public static boolean isSubFile(String parent, String child) throws IOException {
return isSubFile(new File(parent), new File(child));
}
監視文件改變
JDK7新特性,但是API比較難用。TODO
淘寶有個diamond的配置管理項目,是利用定時器不斷去讀取來文件是否改變的。
JDK7則是利用了linux的inotify機制。
Web服務器防止非法的文件路徑訪問
字符截斷攻擊和文件歷遍漏洞原理:在文件名中插入%00的URL編碼,web服務器會把%00後面的內容拋棄。
例如這樣的URL:http://www.test.com/../../../../etc/passwd%00.gif
防範方法
寫入文件前,判斷文件是否在父路徑下,參考上面的函數。
利用Java的安全機制
// All files in /img/java can be read
grant codeBase "file:/home/programpath/" {
permission Permission "/img/java", "read";
};
Tomcat的設置
靜態資源不要自己手寫代碼去讀取,儘量使用Web服務器或者Web框架的本身的靜態資源映射功能。
比如Tomcat的默認自帶的ultServlet:
default
/static/*
Spring mvc可以配置
或者使用spring mvc裏的DefaultServletHttpRequestHandler。這個默認優先級是最低的,也就是最後沒人處理的URL會交給WebServer本身的default servlet去處理。比如Tomcat的就是上面所説的。
個人推薦使用DefaultServletHttpRequestHandler,因為Web容器的文件訪問功能要比Spring mvc自身的要強大。比如Tomcat的DefaultServlet支持Etag,斷點續傳,緩存等。
-
Java 正則表達式
Java是一門編程語言,那麼大家知道Java正則表達式是怎樣的呢?下面一起來看看!Java正則表達式正則表達式定義了字符串的模式。正則表達式可以用來搜索、編輯或處理文本。正則表達式並不僅限於某一種語言,但是在每種語言中有細微的差別。正則表達式實例一個字符串其...
-
Java中的對象與引用知識詳解
在Java中,有一組名詞經常一起出現,它們就是“對象和對象引用”,很多朋友在初學Java的時候可能經常會混淆這2個概念,覺得它們是一回事,事實上則不然。今天我們就來一起了解一下對象和對象引用之間的區別和聯繫。以下僅供參考!1.何謂對象?在Java中有一句比較流行的話,叫...
-
java日期時間基本操作方法
1.獲得Calendar實例:Calendarc=nstance();2.定義日期/時間的格式:SimpleDateFormatsdf=newSimpleDateFormat("yyyy-MM-ddHH:mm:ss");3.把日期/時間轉換成固定格式,使用SimpleDateFormat的'format()方法:Stringdatetime=at(ime());4.把字符串轉換成日期/時間,...
-
Java發展史之Java的由來
Java發展史之Java的由來Java:由SunMicrosystems公司於1995年5月推出的Java程序設計語言和Java平台的總稱。Java語言是一種可以撰寫跨平台應用軟件的面向對象的程序設計語言,由當時任職太陽微系統的詹姆斯·高斯林(JamesGosling)等人於1990年代初開發,它最初被命名為...