Javaについて徹底解説!

Javaでファイル読み込みする3つの方法 簡単なものから性能重視まで!

大石 英人

開発エンジニア/Java20年/Java GOLD/リーダー/ボールド歴2年

Javaが誕生したのは1995年、2019年現在では24年ほどの歴史があります。その長い歴史の中では、ファイルの読み込み方も少しずつ変わっています。

Javaでのファイルの読み込み方には、Java 11の時点では大きく分けて以下の三つの方法があります。それぞれ特徴がありますので、この記事でぜひそれぞれの使い方を身に着けてください。

  • java.nio.file.Filesで読み込む
  • java.io.FileReader/FileInputStreamで読み込む
  • java.nio.channels.FileChannelで読み込む

※この記事のサンプルは、Java 11の環境で動作確認しています


1.【お手軽】Filesで読み込む

Java 11が出てしばらく経った今、一番お手軽なのはjava.nio.file.Filesを使うことです。ものすごく簡単で、今まで勉強してきたノウハウはなんだったのかと、愕然とするくらいです。

1-1.ファイルの内容をStringにする【Java 11以降】

テキストファイルをすべて一度に読み込んで一つのStringにするには、Files.readStringを使います(Java 11以降)

ちなみに、引数がPathだけのFiles.readStringは、ファイルのエンコーディング(いわゆる文字コードのことです)UTF-8であることが前提です。エンコーディングがUTF-8以外のファイルを読ませると、文字化けしてしまいます。

Shift-JISなど、UTF-8以外のエンコーディングのファイルを読みたいなら、引数にjava.nio.charset.Charsetを指定できるメソッドがありますので、それらを使いましょう。

Filesには他にも便利なメソッドがたくさんありますが、エンコーディングの指定の仕方は全て同じです。

1-2.ファイルの内容をStringListにする【Java 7以降】

Files.readAllLinesを使えば、ファイルの内容をStringListにすることも超簡単です(Java 7以降)

1-3.ファイルの内容をbyte配列にする【Java 7以降】

同じノリで、Files.readAllBytesを使って、ファイルをバイナリデータとしてbyte配列に読み込んでみましょう(Java 7以降)。これもメソッド一つで簡単にできます。

1-4.ファイルの内容をStreamで読み込む【Java 8以降】

Files.linesを使えば、ファイルの各行を持つStreamを作れます(Java 8以降)。ファイルの内容を入力元としたStreamを簡単に作れるので、色々と手間が省けます。

1-5.Filesを使う時はメモリ不足に気を付けよう

Filesのメソッドを使う時は、何Gバイトもあるような巨大なファイルには使わないようにしましょう。OutOfMemoryErrorが簡単に起きてしまいます。

Filesのメソッドは使い方がとても簡単です。プログラムもとても短く書けますので、普段使いとしては便利なものです。でも、逆にプログラム上でのファイルの読み込み方を隠してしまってもいます。

ですので、もしJavaのファイル読み込みの勉強をしたいなら、次章で説明するReader/InputStreamの使い方を学んでおいた方が良いでしょう。メモリを効率的に使えますし、クラスごとの機能を組み合わせて作る、Decoratorパターンの見本でもあるからです。


2.【基本】Reader/InputStreamで読み込む

Java 7でFilesが追加されるまでは、java.io.FileReaderFileInputStreamなどを使ってファイルを読み込むのが、Javaでの普通でした。もちろん、これらは今でも使えます。

このやり方なら、現在のJavaの環境であれば、まず100%どこでも使えます。互換性を重視した大安定な方法と言えますし、このやり方ならわかるという人も非常に多いでしょう。

2-1.テキストファイルを一行ずつ読み込む

テキストファイルを読み込む場合は、FileReaderの他に、BufferedReader/FileInputStream/InputStreamReaderなどを組み合わせます。

FileReaderだけでもテキストファイルの読み込みはできますが、intでの文字単位やcharの配列でしか読み込めないので、使い勝手はよくありません。

BufferedReaderと組み合わせれば、BufferedReader.readLineを使って行単位で読み込めます。しかも、BufferedReaderでのバッファリングにより読み込みの性能も向上しますので、このやり方がJavaでのスタンダードです。

2-1-1.FileReaderで読み込む

FileReaderとBufferedReaderを使うのは、ファイルのエンコーディングがJavaを実行している環境のデフォルトでいい場合です。

この例ではファイルを先頭行から順番に読み込んでいます。ファイルを読み込み終わったらcloseを忘れないように!!

プログラムを短くするのと、closeを忘れないためにも、Java 7以降で使えるtry-with-resourcesと組み合わせるのが鉄板です。Java 6以前なら、try-finallyと組み合わせましょう。

2-1-2.FileInputStreamでエンコーディングを指定して読み込む

ファイルのエンコーディングを指定する場合は、java.io.InputStreamReaderFileInputStremも組み合わせましょう。このように、やり方が少し違うのが覚えづらいところです。

2-1-3.【Java 8以降】FilesからBufferedReaderを取得して読み込む

ちなみに、ファイルを読み込むためのBufferedReaderは、Files.newBufferedReaderでも取得できます(Java 8以降)。BufferedReaderを取得すれば、同様の使い方が出来ます。

2-2.バイナリファイルを読み込む

バイナリファイルを読み込む場合は、java.io.BufferedInputStreamとFileInputStreamを組み合わせます。BufferedInputStreamは、BufferedReaderと同じような、バッファリングをする役割を持つInputStreamです。

以下の例のように、ある程度の大きさのbyte配列を作って、配列の中に少しずつ読み込んでいくのが普通です。readの戻り値は読み込んだデータのバイト数ですので、それを上限として配列からデータを読みます。

ファイル全体を一気に読み込むこともできます。ファイルのサイズを調べた上で、その大きさのbyte配列を作り、一気にreadします。ある程度小さいことが分かっているファイルなら、こちらの方がループがいらないので簡単です。


3.【速度重視】FileChannelで読み込む

3-1.Channelとは速度重視のフレームワーク

Java 1.4で導入されたNIO(New I/O)で、Channelというフレームワークが導入されました。これはBufferというクラスと組み合わせて使うもので、何かへの入出力の速さを重視する場合に使います。

その「何か」には、当然ファイルもあります。ファイルの入力にjava.nio.channels.FileChannelを使うと、Readerよりもずっと速く読み込めるのです。

3-2.FileChannelとReaderは使い方が全く違う

ただし、FileChannelはReader/InputStreamとは使い方がまったく違います。Channel/Bufferの概念や、使い方の知識を学ぶ必要があります。

速度が求められないファイル読み込みにFileChannelを使うと、ChannelBufferのことを知らないプログラマがついてこれない可能性が高いので、あまりお勧めはできません。分かっている人向けです。

ここではFileChannelByteBufferについて、簡単に触れるだけに留めます。もし、プログラム上で速度を重視するファイル読み込みが必要になった場合は、この内容を起点にして調べてみてください。

なお、FileChannelではファイルのロック(排他制御)が出来るなど、ReaderFilesにはない、便利な機能もありますよ。

3-3.FileChannelとByteBufferを使ってみる

FileChannelは、FileChannel.openで直接取得するか(Java 7以降)、FileInputStreamやRandomAccessFileのようなファイル系Streamから取得します。ここでは、FileChannelから取得してみます。

そして、FileChannelからのデータの受け口として、1024バイト分の領域を持ったByteBufferも用意します。これは、Readerでバイナリファイルを読み込む時に用意したbyte配列の役割に近いものです。

FileChannel.readをByteBufferを引数に実行すると、Channel自身が把握しているファイル内の現在位置から、ByteBufferへファイルの読み込みが行われます。これをファイルのすべてを読み込むまで繰り返します。

この例では単純にファイルの先頭から1024バイトずつ読み込んでいますが、FileChannelではファイル内のランダムアクセスが出来ますので、用途によっては便利なものです。

3-4.FileChannelを使ったファイルコピー

Java 7になるまで、Javaには標準のファイルコピー用メソッドがありませんでした。ですから、FileInputStreamFileOutputStreamを組み合わせて自作するか、外部のライブラリを使うのが普通でした。

でも、速度重視の場合はFileChannelを使って、以下のようにもできます。さすがにFiles.copyよりは行数が多いですが、InputStream/OutputStreamを使うよりは短くできていますね。


4.【参考】Javaでよく使うファイルの読み込み方

4-1.プロパティファイルを読み込む【標準API

Javaではプロパティファイル(.properties)を良く使います。それらを読み込むにはいくつかのやり方があるのですが、ここではjava.util.Propertiesjava.util.ResourceBundleを使ったやり方を紹介します。

なお、ここではPC上のディレクトリ・フォルダにあるプロパティファイルを読み込む方法です。PC上に「/A/B/C.properties」というプロパティファイルがあるとします。

クラスパス上にあるプロパティファイルを読み込むには、ClassLoaderとクラスパス上にあるモノを指定するパスの知識が必要になります。そちらは別途調べてみましょう。

4-2.XMLを読み込む【標準API

XMLもとても良く使うファイルです。Javaでは標準APIXMLを読み込むためのクラスがいくつかあります。それぞれが、XMLを操作するためにJavaの外で決められている標準APIに対応するものです。

それぞれやり方が異なりますので、以下では簡単に紹介します。

4-2-1.DOM(Document Object Model)

DOM(Document Object Model)は、JavaScriptでも用いられる、XML操作APIの標準です。

JavaではDOMを操作するためのクラスDocumentを、DocumentBuilderというクラスを使って作ります。Documentが持つメソッドは、インターネット標準のDOMと同じものです。

C.xml

4-2-2.SAX

JavaでXMLを読み込む際のもう一つのやり方はSAX(Simple API for XML)です。こちらはDOMとは少々プログラムの仕方が違い、イベント駆動型となります。

SAXがXMLを頭から順番に読み込み、XMLの要素や属性が出てくるたびに、指定したXML解析クラスのメソッドが呼ばれます。ですので、複雑な構造のXMLでも、特定の要素にフォーカスすればいい場合には便利なものです。

4-3.JSONを読み込む【外部ライブラリ】

最近はJSON(JavaScript Object Notation)を扱う機会が大変増えてきましたよね。

JavaではJSONを扱うやり方はいくつかあります。ここではその一つ、Jacksonを使ってのJSON形式のファイルからの読み込み方を簡単に紹介します。

Jacksonについては、以下の記事も参考にしてください。

関連記事

C.json

4-4.Excelを読み込む【外部ライブラリ】

プログラムではExcel形式のファイル(ファイル拡張子xlsxlsxなど)を読み込まなければならない時もあります。JavaExcel形式のファイルを扱うなら、Apache POI(https://poi.apache.org/)を使うと便利ですよ。

以下の例では、1つ目のシートのA1セルにある値を、テキストとして読み取っています。WorkbookSheetRowCellなどのクラスにより、かなり直感的に扱えていることが分かるかと思います。

4-5.CSVを読み込む【外部ライブラリ】

データをやり取りするのにお手軽なのは、今も昔もCSV(Comma-Separated Values)です。

JavaでCSVを扱う時は、テキストファイルとして読み込んで各行を“,”splitしてもいいのですが、実はCSVは結構複雑な仕様があって、きちんとしたプログラムを作るには大変なものだったりします。

これも外部ライブラリを使うと大変お手軽に読み込めます。ここでは、Apache Commons CSV(http://commons.apache.org/proper/commons-csv/)を簡単に紹介します。

C.csv


5.まとめ

この記事では、Javaでのファイルの読み込み方をお伝えしました。

今では、一番簡単なのはFilesを使うことです。どの環境でも動かしたいなら、FileReader/FileInputStreamBufferedReader/BufferedInputStreamを組み合わせます。読み込みの速度を優先するなら、FileChannelByteBufferを使います。

テキストファイル・バイナリファイル以外にも、Javaで日常的に読み込むファイルの形式は多いです。よく使われるプロパティファイル、XMLJSONExcelCSVなども、Javaではしっかり読み込めます。

この記事でお伝えしたのは、大体はJavaの標準APIで提供されている機能を使ったやり方です。Javaには標準API以外にもApache Commons IOなどの豊富なライブラリがあります。それらを調べて、活用してみると便利ですよ。

私たちは、全てのエンジニアに市場価値を高め自身の望む理想のキャリアを歩んでいただきたいと考えています。もし、今あなたが転職を検討しているのであればこちらの記事をご一読ください。理想のキャリアを実現するためのヒントが見つかるはずです。

『技術力』と『人間力』を高め市場価値の高いエンジニアを目指しませんか?

私たちは「技術力」だけでなく「人間力」の向上をもって遙かに高い水準の成果を出し、関わる全ての人々に感動を与え続ける集団でありたいと考えています。

高い水準で仕事を進めていただくためにも、弊社では次のような環境を用意しています。

  • 定年までIT業界で働くためのスキル(技術力、人間力)が身につく支援
  • 「給与が上がらない」を解消する6ヶ月に1度の明確な人事評価制度
  • 平均残業時間17時間!毎週の稼動確認を徹底しているから実現できる働きやすい環境

現在、株式会社ボールドでは「キャリア採用」のエントリーを受付中です。

まずは以下のボタンより弊社の紹介をご覧いただき、あなたの望むキャリアビジョンをエントリーフォームより詳しくお聞かせください。

コメント