回答:
注:受け入れられた回答は、Goの初期バージョンでは正解でした。 最高投票数の回答には、これを達成するための最近の慣用的な方法が含まれています。
パッケージに関数ReadLineがありますbufio
。
行が読み取りバッファーに収まらない場合、関数は不完全な行を返すことに注意してください。関数の1回の呼び出しでプログラムの行全体を常に読み取る場合は、forループReadLine
で呼び出す独自の関数に関数をカプセル化する必要がありReadLine
ます。
bufio.ReadString('\n')
は、がファイルの最後の行が改行文字で終わっていない場合に対応できないReadLine
ため、ReadString
と完全に同等ではありません。
Go 1.1以降では、これを行う最も簡単な方法はを使用することbufio.Scanner
です。次に、ファイルから行を読み取る簡単な例を示します。
package main
import (
"bufio"
"fmt"
"log"
"os"
)
func main() {
file, err := os.Open("/path/to/file.txt")
if err != nil {
log.Fatal(err)
}
defer file.Close()
scanner := bufio.NewScanner(file)
for scanner.Scan() {
fmt.Println(scanner.Text())
}
if err := scanner.Err(); err != nil {
log.Fatal(err)
}
}
これは、1 Reader
行ずつ読み取る最もクリーンな方法です。
注意点が1つあります。スキャナーは65536文字を超える行を適切に処理しません。それがあなたにとって問題であるならば、あなたはおそらくあなた自身の上にあなた自身を転がすべきですReader.Read()
。
file, _ := os.Open("/path/to/file.csv")
し、ファイルハンドルの上にスキャン:scanner := bufio.NewScanner(file)
defer file.Close()
。
bufio.ErrTooLong
エラーが発生しますbufio.Scanner: token too long
。その場合は、bufio.ReaderLine()またはReadString()を使用する必要があります。
使用する:
reader.ReadString('\n')
\n
返される文字列の末尾。reader.ReadLine()
他の回答で問題として特定されたシナリオをテストするプログラムを作成することによって提案されたさまざまなソリューションをテストしました。
見つけた:
Scanner
ソリューションは、長い行を処理しません。ReadLine
ソリューションを実装するために複雑です。ReadString
ソリューションは、最も簡単で、長い行のために動作します。各ソリューションを示すコードはgo run main.go
次のとおりです。これは次の方法で実行できます。
package main
import (
"bufio"
"bytes"
"fmt"
"io"
"os"
)
func readFileWithReadString(fn string) (err error) {
fmt.Println("readFileWithReadString")
file, err := os.Open(fn)
defer file.Close()
if err != nil {
return err
}
// Start reading from the file with a reader.
reader := bufio.NewReader(file)
var line string
for {
line, err = reader.ReadString('\n')
fmt.Printf(" > Read %d characters\n", len(line))
// Process the line here.
fmt.Println(" > > " + limitLength(line, 50))
if err != nil {
break
}
}
if err != io.EOF {
fmt.Printf(" > Failed!: %v\n", err)
}
return
}
func readFileWithScanner(fn string) (err error) {
fmt.Println("readFileWithScanner - this will fail!")
// Don't use this, it doesn't work with long lines...
file, err := os.Open(fn)
defer file.Close()
if err != nil {
return err
}
// Start reading from the file using a scanner.
scanner := bufio.NewScanner(file)
for scanner.Scan() {
line := scanner.Text()
fmt.Printf(" > Read %d characters\n", len(line))
// Process the line here.
fmt.Println(" > > " + limitLength(line, 50))
}
if scanner.Err() != nil {
fmt.Printf(" > Failed!: %v\n", scanner.Err())
}
return
}
func readFileWithReadLine(fn string) (err error) {
fmt.Println("readFileWithReadLine")
file, err := os.Open(fn)
defer file.Close()
if err != nil {
return err
}
// Start reading from the file with a reader.
reader := bufio.NewReader(file)
for {
var buffer bytes.Buffer
var l []byte
var isPrefix bool
for {
l, isPrefix, err = reader.ReadLine()
buffer.Write(l)
// If we've reached the end of the line, stop reading.
if !isPrefix {
break
}
// If we're just at the EOF, break
if err != nil {
break
}
}
if err == io.EOF {
break
}
line := buffer.String()
fmt.Printf(" > Read %d characters\n", len(line))
// Process the line here.
fmt.Println(" > > " + limitLength(line, 50))
}
if err != io.EOF {
fmt.Printf(" > Failed!: %v\n", err)
}
return
}
func main() {
testLongLines()
testLinesThatDoNotFinishWithALinebreak()
}
func testLongLines() {
fmt.Println("Long lines")
fmt.Println()
createFileWithLongLine("longline.txt")
readFileWithReadString("longline.txt")
fmt.Println()
readFileWithScanner("longline.txt")
fmt.Println()
readFileWithReadLine("longline.txt")
fmt.Println()
}
func testLinesThatDoNotFinishWithALinebreak() {
fmt.Println("No linebreak")
fmt.Println()
createFileThatDoesNotEndWithALineBreak("nolinebreak.txt")
readFileWithReadString("nolinebreak.txt")
fmt.Println()
readFileWithScanner("nolinebreak.txt")
fmt.Println()
readFileWithReadLine("nolinebreak.txt")
fmt.Println()
}
func createFileThatDoesNotEndWithALineBreak(fn string) (err error) {
file, err := os.Create(fn)
defer file.Close()
if err != nil {
return err
}
w := bufio.NewWriter(file)
w.WriteString("Does not end with linebreak.")
w.Flush()
return
}
func createFileWithLongLine(fn string) (err error) {
file, err := os.Create(fn)
defer file.Close()
if err != nil {
return err
}
w := bufio.NewWriter(file)
fs := 1024 * 1024 * 4 // 4MB
// Create a 4MB long line consisting of the letter a.
for i := 0; i < fs; i++ {
w.WriteRune('a')
}
// Terminate the line with a break.
w.WriteRune('\n')
// Put in a second line, which doesn't have a linebreak.
w.WriteString("Second line.")
w.Flush()
return
}
func limitLength(s string, length int) string {
if len(s) < length {
return s
}
return s[:length]
}
私はテストしました:
テストプログラムの出力:
Long lines
readFileWithReadString
> Read 4194305 characters
> > aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
> Read 12 characters
> > Second line.
readFileWithScanner - this will fail!
> Failed!: bufio.Scanner: token too long
readFileWithReadLine
> Read 4194304 characters
> > aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
> Read 12 characters
> > Second line.
No linebreak
readFileWithReadString
> Read 28 characters
> > Does not end with linebreak.
readFileWithScanner - this will fail!
> Read 28 characters
> > Does not end with linebreak.
readFileWithReadLine
> Read 28 characters
> > Does not end with linebreak.
defer file.Close()
エラーチェックした後でなければなりません。それ以外の場合は、エラー時にパニックになります。
ファイルから各行を簡単に読み取る方法を書きました。Readln(* bufio.Reader)関数は、基になるbufio.Reader構造体から行(sans \ n)を返します。
// Readln returns a single line (without the ending \n)
// from the input buffered reader.
// An error is returned iff there is an error with the
// buffered reader.
func Readln(r *bufio.Reader) (string, error) {
var (isPrefix bool = true
err error = nil
line, ln []byte
)
for isPrefix && err == nil {
line, isPrefix, err = r.ReadLine()
ln = append(ln, line...)
}
return string(ln),err
}
Readlnを使用して、ファイルからすべての行を読み取ることができます。次のコードは、ファイルのすべての行を読み取り、各行をstdoutに出力します。
f, err := os.Open(fi)
if err != nil {
fmt.Printf("error opening file: %v\n",err)
os.Exit(1)
}
r := bufio.NewReader(f)
s, e := Readln(r)
for e == nil {
fmt.Println(s)
s,e = Readln(r)
}
乾杯!
ファイルを1行ずつ読み取る一般的な方法は2つあります。
私のテストケースでは、〜250MB、〜2,500,000行、bufio.Scanner(使用時間:0.395491384s)はbufio.Reader.ReadString(time_used:0.446867622s)より高速です。
ソースコード: https //github.com/xpzouying/go-practice/tree/master/read_file_line_by_line
ファイルを読み取るには、bufio.Scannerを使用します。
func scanFile() {
f, err := os.OpenFile(logfile, os.O_RDONLY, os.ModePerm)
if err != nil {
log.Fatalf("open file error: %v", err)
return
}
defer f.Close()
sc := bufio.NewScanner(f)
for sc.Scan() {
_ = sc.Text() // GET the line string
}
if err := sc.Err(); err != nil {
log.Fatalf("scan file error: %v", err)
return
}
}
ファイルを読み取るには、bufio.Readerを使用します。
func readFileLines() {
f, err := os.OpenFile(logfile, os.O_RDONLY, os.ModePerm)
if err != nil {
log.Fatalf("open file error: %v", err)
return
}
defer f.Close()
rd := bufio.NewReader(f)
for {
line, err := rd.ReadString('\n')
if err != nil {
if err == io.EOF {
break
}
log.Fatalf("read file line error: %v", err)
return
}
_ = line // GET the line string
}
}
bufio.Reader
例では、改行で終わっていない場合、ファイルの最後の行を読み取らないことに注意してください。ReadString
最後の行とio.EOF
この場合の両方を返します。
この要点の例
func readLine(path string) {
inFile, err := os.Open(path)
if err != nil {
fmt.Println(err.Error() + `: ` + path)
return
}
defer inFile.Close()
scanner := bufio.NewScanner(inFile)
for scanner.Scan() {
fmt.Println(scanner.Text()) // the line
}
}
ただし、スキャナーのバッファーよりも大きい行があると、エラーが発生します。
それが起こったとき、私がやっていることは、reader := bufio.NewReader(inFile)
createまたはconcatを使用して、ch, err := reader.ReadByte()
またはlen, err := reader.Read(myBuffer)
私が使用する別の方法(上記のようにos.Stdinをファイルで置き換える)、これは行が長い(isPrefix)ときに連結し、空の行を無視します。
func readLines() []string {
r := bufio.NewReader(os.Stdin)
bytes := []byte{}
lines := []string{}
for {
line, isPrefix, err := r.ReadLine()
if err != nil {
break
}
bytes = append(bytes, line...)
if !isPrefix {
str := strings.TrimSpace(string(bytes))
if len(str) > 0 {
lines = append(lines, str)
bytes = []byte{}
}
}
}
if len(bytes) > 0 {
lines = append(lines, string(bytes))
}
return lines
}
-1
?
ReadStringを\ nをセパレータとして使用することもできます。
f, err := os.Open(filename)
if err != nil {
fmt.Println("error opening file ", err)
os.Exit(1)
}
defer f.Close()
r := bufio.NewReader(f)
for {
path, err := r.ReadString(10) // 0x0A separator = newline
if err == io.EOF {
// do something here
break
} else if err != nil {
return err // if you return error
}
}
bufio.Reader.ReadLine()はうまく機能します。ただし、各行を文字列で読み取る場合は、ReadString( '\ n')を使用してみてください。ホイールを再発明する必要はありません。
// strip '\n' or read until EOF, return error if read error
func readline(reader io.Reader) (line []byte, err error) {
line = make([]byte, 0, 100)
for {
b := make([]byte, 1)
n, er := reader.Read(b)
if n > 0 {
c := b[0]
if c == '\n' { // end of line
break
}
line = append(line, c)
}
if er != nil {
err = er
return
}
}
return
}
私はLzapソリューションが好きです、私はGoの新人です、私はlzapに頼むのが好きですが、それを実行できませんでした。まだ50ポイントを持っていません。
package main
import (
"bufio"
"fmt"
"io"
"os"
)
func main() {
f, err := os.Open("archiveName")
if err != nil {
fmt.Println(err)
os.Exit(1)
}
defer f.Close()
r := bufio.NewReader(f)
line, err := r.ReadString(10) // line defined once
for err != io.EOF {
fmt.Print(line) // or any stuff
line, err = r.ReadString(10) // line was defined before
}
}
なぜ「err」を再度テストする必要があるのかはわかりませんが、とにかくそれを行うことができます。しかし、主な質問は..ループ内で=>行err:= r.ReadString(10)という文でエラーが発生しないのはなぜですか?ループが実行されるたびに何度も定義されます。私の変更で、そのような状況を回避します、コメントはありますか?「for」の条件EOFをWhileと同様に設定しました。ありがとう
import (
"bufio"
"os"
)
var (
reader = bufio.NewReader(os.Stdin)
)
func ReadFromStdin() string{
result, _ := reader.ReadString('\n')
witl := result[:len(result)-1]
return witl
}
ここでは機能を持つ例であるReadFromStdin()
、それはようなものだfmt.Scan(&name)
「...こんにちは私の名前である」:しかし、そのようには空白を持つすべての文字列を取ります
var name string = ReadFromStdin()
println(name)
もう1つの方法は、io/ioutil
およびstrings
ライブラリを使用してファイルのバイト全体を読み取り、それらを文字列に変換し\n
、区切り文字として" "(改行)文字を使用して分割することです。次に例を示します。
import (
"io/ioutil"
"strings"
)
func main() {
bytesRead, _ := ioutil.ReadFile("something.txt")
file_content := string(bytesRead)
lines := strings.Split(file_content, "\n")
}
技術的にはファイルを1行ずつ読み取っていませんが、この手法を使用して各行を解析できます。この方法は、小さいファイルに適用できます。大規模なファイルを解析しようとしている場合は、1行ずつ読み取る手法のいずれかを使用してください。