PythonでASCIIテーブルをプリティプリントするにはどうすればよいですか?[閉まっている]


81

次のようなテーブルをきれいに印刷する方法を探しています。

=======================
| column 1 | column 2 |
=======================
| value1   | value2   |
| value3   | value4   |
=======================

asciitableライブラリを見つけましたが、境界線などはありません。データ項目の複雑なフォーマットは必要ありません。それらは単なる文字列です。列のサイズを自動化するために必要です。

他のライブラリやメソッドが存在しますか、それとも自分で作成するのに数分かかる必要がありますか?


docutilsを使用してこれを行ってみませんか?
S.Lott

あなたはテーブルを何と呼びますか?データはどのようにテーブルに編成されていますか?value1、value2、value3、value4 ...はリスト内の連続する値ですか?fomat()は、このような単純な表示を取得するのに十分だと思います。ライブラリを使用して時間を稼ぐ方法を説明するチュートリアルを長い間学ぶ必要はありません
eyquem

2
@korona:いいえ、私は提案をしていませんでした。私は質問をしていました。@kdtが何を知っているのか、何を知らないのか、私にはわかりません。想定するのではなく、尋ねざるを得ないと感じています。
S.Lott

5
あなたが実際に彼がdocutilsについて知っていると仮定していたように私には聞こえました。多分彼はしませんか?
コロナ

2
@ S.Lott docutilsを見てきましたが、もちろんテキストをhtmlやlatexなどに変換するのに最適ですが、列が並んできれいに見える素敵なテキストテーブルを生成する方法がわかりません。固定幅フォント。kdtの目標を誤解しましたか、それとも何かが足りませんか?
nealmcb 2012年

回答:


72

私はずっと前にこの質問を読み、テーブル用の独自のプリティプリンターを書き終えましたtabulate

私のユースケースは次のとおりです。

  • ほとんどの場合ワンライナーが欲しい
  • これは私にとって最適なフォーマットを見つけるのに十分賢いです
  • さまざまなプレーンテキスト形式を出力できます

あなたの例を考えると、gridおそらく最も類似した出力形式です:

from tabulate import tabulate
print tabulate([["value1", "value2"], ["value3", "value4"]], ["column 1", "column 2"], tablefmt="grid")
+------------+------------+
| column 1   | column 2   |
+============+============+
| value1     | value2     |
+------------+------------+
| value3     | value4     |
+------------+------------+

その他のサポートされている形式はplainsimple(行なし)、(Pandoc単純テーブル)、pipe(PHP Markdown Extraのorgtblテーブルのように)、(Emacsのorg-modeのrstテーブルのように)、(reStructuredTextの単純テーブルのように)です。gridそしてorgtblEmacsで簡単に編集可能です。

パフォーマンスに関してtabulateは、よりもわずかに遅くなりますがasciitablePrettyTableおよびよりもはるかに高速ですtexttable

PS私はまた、数字を揃えるの大ファンだ進列で。したがって、これは、数値がある場合のデフォルトの配置です(オーバーライド可能)。


4
たまたま集計ソリューションが必要でしたが、幸運にもあなたのライブラリを見つけることができました。チャームのように機能します:D聞いている場合は、ありがとうと言いたかっただけです:)
deepak 2016年

2
はい、聞いています。優しい言葉ありがとうございます。正のフィードバックを得るのは本当に素晴らしいです。
サスタニン2016年

1
こんにちは、@ sastaninまず第一に、このような素晴らしいライブラリをありがとうございました。ターミナルの全幅にまたがるテーブルを印刷するオプションがあることを知っていますか?
Validus Oculus 2016

1
こんにちはサスタニン、この非常に便利なパッケージに感謝するためにここに一言ドロップしたかっただけです。チャームのように機能し、自分で書く手間を省きました。共有してくれてありがとう!
バレンティン

1
あなたの機能リストは控えめな表現です。ansiエスケープされたものを試してみましたが、完璧に機能します。これをありがとう!
レッドピル

37

これは、SOAPAPIを介してのみ作成できるSQLクエリの結果を表示するために作成した簡単で汚い小さな関数です。1つ以上のシーケンスの入力をnamedtuplesテーブル行として想定しています。レコードが1つしかない場合は、印刷方法が異なります。

それは私にとって便利であり、あなたにとっての出発点になる可能性があります。

def pprinttable(rows):
  if len(rows) > 1:
    headers = rows[0]._fields
    lens = []
    for i in range(len(rows[0])):
      lens.append(len(max([x[i] for x in rows] + [headers[i]],key=lambda x:len(str(x)))))
    formats = []
    hformats = []
    for i in range(len(rows[0])):
      if isinstance(rows[0][i], int):
        formats.append("%%%dd" % lens[i])
      else:
        formats.append("%%-%ds" % lens[i])
      hformats.append("%%-%ds" % lens[i])
    pattern = " | ".join(formats)
    hpattern = " | ".join(hformats)
    separator = "-+-".join(['-' * n for n in lens])
    print hpattern % tuple(headers)
    print separator
    _u = lambda t: t.decode('UTF-8', 'replace') if isinstance(t, str) else t
    for line in rows:
        print pattern % tuple(_u(t) for t in line)
  elif len(rows) == 1:
    row = rows[0]
    hwidth = len(max(row._fields,key=lambda x: len(x)))
    for i in range(len(row)):
      print "%*s = %s" % (hwidth,row._fields[i],row[i])

サンプル出力:

pkid | fkn | npi
------------------------------------- + ------------ -------------------------- + ----
405fd665-0a2f-4f69-7320-be01201752ec | 8c9949b9-552e-e448-64e2-74292834c73e | 0
5b517507-2a42-ad2e-98dc-8c9ac6152afa | f972bee7-f5a4-8532-c4e5-2e82897b10f6 | 0
2f960dfc-b67a-26be-d1b3-9b105535e0a8 | ec3e1058-8840-c9f2-3b25-2488f8b3a8af | 1
c71b28a3-5299-7f4d-f27a-7ad8aeadafe0 | 72d25703-4735-310b-2e06-ff76af1e45ed | 0
3b0a5021-a52b-9ba0-1439-d5aafcf348e7 | d81bb78a-d984-e957-034d-87434acb4e97 | 1
96c36bb7-c4f4-2787-ada8-4aadc17d1123 | c171fe85-33e2-6481-0791-2922267e8777 | 1
95d0f85f-71da-bb9a-2d80-fe27f7c02fe2 | 226f964c-028d-d6de-bf6c-688d2908c5ae | 1
132aa774-42e5-3d3f-498b-50b44a89d401 | 44e31f89-d089-8afc-f4b1-ada051c01474 | 1
ff91641a-5802-be02-bece-79bca993fdbc | 33d8294a-053d-6ab4-94d4-890b47fcf70d | 1
f3196e15-5b61-e92d-e717-f00ed93fe8ae | 62fa4566-5ca2-4a36-f872-4d00f7abadcf | 1

>>> from collections import namedtuple
>>> Row = namedtuple('Row',['first','second','third'])
>>> data = Row(1,2,3)
>>> data
Row(first=1, second=2, third=3)
>>> pprinttable([data])
 first = 1
second = 2
 third = 3
>>> pprinttable([data,data])
first | second | third
------+--------+------
    1 |      2 |     3
    1 |      2 |     3

@MattHこの関数の使用法を例で示すことができますか?
theAlse 2012

1
@MattHありがとう、しかし大きな数はすぐにそれをクラッシュさせるようです。TypeError:タイプ 'int'のオブジェクトにはlen()がありません。
theAlse 2012

@Alborz:私はこれを他の人の出発点として投稿しました。必要に応じて、データ型を処理するようにカスタマイズしてください。エラーが発生した行によっては、意図したとおりに関数を呼び出さない場合があります
MattH 2012

1
@theAlse私はあなたが特定したバグをlen(str(max(...)))lens.append行に追加して修正しました。したがって、列の数値が列ヘッダーよりも広い場合でも、問題はありません。ところで、MattH-max()への「key」引数のかわいい使用法!
nealmcb 2012年

19

どういうわけか、グーグル検索に「docutils」を含めたとき、私はtexttableに出くわしました。それは私が探しているもののようです。


2
良いですね。自動列幅検出がありません。使用:pastebin.com/SAsPJUxM
Kos

12

私もこれに対する独自の解決策を書きました。シンプルにしようとしました。

https://github.com/Robpol86/terminaltables

from terminaltables import AsciiTable
table_data = [
    ['Heading1', 'Heading2'],
    ['row1 column1', 'row1 column2'],
    ['row2 column1', 'row2 column2']
]
table = AsciiTable(table_data)
print table.table
+--------------+--------------+
| Heading1     | Heading2     |
+--------------+--------------+
| row1 column1 | row1 column2 |
| row2 column1 | row2 column2 |
+--------------+--------------+

table.inner_heading_row_border = False
print table.table
+--------------+--------------+
| Heading1     | Heading2     |
| row1 column1 | row1 column2 |
| row2 column1 | row2 column2 |
+--------------+--------------+

table.inner_row_border = True
table.justify_columns[1] = 'right'
table.table_data[1][1] += '\nnewline'
print table.table
+--------------+--------------+
| Heading1     |     Heading2 |
+--------------+--------------+
| row1 column1 | row1 column2 |
|              |      newline |
+--------------+--------------+
| row2 column1 | row2 column2 |
+--------------+--------------+

9

この目的のためにtermtablesをリリースしました。たとえば、これ

import termtables as tt

tt.print(
    [[1, 2, 3], [613.23236243236, 613.23236243236, 613.23236243236]],
    header=["a", "bb", "ccc"],
    style=tt.styles.ascii_thin_double,
    padding=(0, 1),
    alignment="lcr"
)

あなたを取得します

+-----------------+-----------------+-----------------+
| a               |       bb        |             ccc |
+=================+=================+=================+
| 1               |        2        |               3 |
+-----------------+-----------------+-----------------+
| 613.23236243236 | 613.23236243236 | 613.23236243236 |
+-----------------+-----------------+-----------------+

デフォルトでは、テーブルはUnicodeのボックス描画文字でレンダリングされます。

┌─────────────────┬─────────────────┬─────────────────┐
│ a               │       bb        │             ccc │
╞═════════════════╪═════════════════╪═════════════════╡
│ 123 │
├─────────────────┼─────────────────┼─────────────────┤
│ 613.23236243236613.23236243236613.23236243236 │
└─────────────────┴─────────────────┴─────────────────┘

termtablesは非常に構成可能です。その他の例については、テストを確認しください。


表示する最大列を設定し、ライブラリにラッピングロジックを処理させることができれば幸いです。
カン・ミニョク

7

BeautifulTableを試すことができます。それはあなたがやりたいことをします。これはそのドキュメントからの例です

>>> from beautifultable import BeautifulTable
>>> table = BeautifulTable()
>>> table.column_headers = ["name", "rank", "gender"]
>>> table.append_row(["Jacob", 1, "boy"])
>>> table.append_row(["Isabella", 1, "girl"])
>>> table.append_row(["Ethan", 2, "boy"])
>>> table.append_row(["Sophia", 2, "girl"])
>>> table.append_row(["Michael", 3, "boy"])
>>> print(table)
+----------+------+--------+
|   name   | rank | gender |
+----------+------+--------+
|  Jacob   |  1   |  boy   |
+----------+------+--------+
| Isabella |  1   |  girl  |
+----------+------+--------+
|  Ethan   |  2   |  boy   |
+----------+------+--------+
|  Sophia  |  2   |  girl  |
+----------+------+--------+
| Michael  |  3   |  boy   |
+----------+------+--------+

/usr/local/lib/python3.8/site-packages/beautifultable/utils.py:113: FutureWarning: 'BeautifulTable.column_headers' has been deprecated in 'v1.0.0' and will be removed in 'v1.2.0'. Use 'BTColumnCollection.header' instead. warnings.warn(message, FutureWarning)
evandrix

/usr/local/lib/python3.8/site-packages/beautifultable/utils.py:113: FutureWarning: 'BeautifulTable.append_row' has been deprecated in 'v1.0.0' and will be removed in 'v1.2.0'. Use 'BTRowCollection.append' instead. warnings.warn(message, FutureWarning)
evandrix

6

MattHのバージョンが受け入れるタイプを処理するように設計されたw3mを使用するバージョン:

import subprocess
import tempfile
import html
def pprinttable(rows):
    esc = lambda x: html.escape(str(x))
    sour = "<table border=1>"
    if len(rows) == 1:
        for i in range(len(rows[0]._fields)):
            sour += "<tr><th>%s<td>%s" % (esc(rows[0]._fields[i]), esc(rows[0][i]))
    else:
        sour += "<tr>" + "".join(["<th>%s" % esc(x) for x in rows[0]._fields])
        sour += "".join(["<tr>%s" % "".join(["<td>%s" % esc(y) for y in x]) for x in rows])
    with tempfile.NamedTemporaryFile(suffix=".html") as f:
        f.write(sour.encode("utf-8"))
        f.flush()
        print(
            subprocess
            .Popen(["w3m","-dump",f.name], stdout=subprocess.PIPE)
            .communicate()[0].decode("utf-8").strip()
        )

from collections import namedtuple
Row = namedtuple('Row',['first','second','third'])
data1 = Row(1,2,3)
data2 = Row(4,5,6)
pprinttable([data1])
pprinttable([data1,data2])

結果:

┌───────┬─┐
│ first │1│
├───────┼─┤
│second │2│
├───────┼─┤
│ third │3│
└───────┴─┘
┌─────┬───────┬─────┐
│first│second │third│
├─────┼───────┼─────┤
│123    │
├─────┼───────┼─────┤
│456    │
└─────┴───────┴─────┘

5

列と行のスパンを持つテーブルが必要な場合は、私のライブラリダッシュテーブルを試してください

from dashtable import data2rst

table = [
        ["Header 1", "Header 2", "Header3", "Header 4"],
        ["row 1", "column 2", "column 3", "column 4"],
        ["row 2", "Cells span columns.", "", ""],
        ["row 3", "Cells\nspan rows.", "- Cells\n- contain\n- blocks", ""],
        ["row 4", "", "", ""]
    ]

# [Row, Column] pairs of merged cells
span0 = ([2, 1], [2, 2], [2, 3])
span1 = ([3, 1], [4, 1])
span2 = ([3, 3], [3, 2], [4, 2], [4, 3])

my_spans = [span0, span1, span2]

print(data2rst(table, spans=my_spans, use_headers=True))

どの出力:

+----------+------------+----------+----------+
| Header 1 | Header 2   | Header3  | Header 4 |
+==========+============+==========+==========+
| row 1    | column 2   | column 3 | column 4 |
+----------+------------+----------+----------+
| row 2    | Cells span columns.              |
+----------+----------------------------------+
| row 3    | Cells      | - Cells             |
+----------+ span rows. | - contain           |
| row 4    |            | - blocks            |
+----------+------------+---------------------+

ERROR: Spans must be a list of lists
CZ

2

質問が少し古いことは知っていますが、これが私の試みです。

https://gist.github.com/lonetwin/4721748

これはもう少し読みやすいIMHOです(@MattHのソリューションのように単一行と複数行を区別せず、NamedTuplesも使用しません)。


2

私はこの小さな効用関数を使用します。

def get_pretty_table(iterable, header):
    max_len = [len(x) for x in header]
    for row in iterable:
        row = [row] if type(row) not in (list, tuple) else row
        for index, col in enumerate(row):
            if max_len[index] < len(str(col)):
                max_len[index] = len(str(col))
    output = '-' * (sum(max_len) + 1) + '\n'
    output += '|' + ''.join([h + ' ' * (l - len(h)) + '|' for h, l in zip(header, max_len)]) + '\n'
    output += '-' * (sum(max_len) + 1) + '\n'
    for row in iterable:
        row = [row] if type(row) not in (list, tuple) else row
        output += '|' + ''.join([str(c) + ' ' * (l - len(str(c))) + '|' for c, l in zip(row, max_len)]) + '\n'
    output += '-' * (sum(max_len) + 1) + '\n'
    return output

print get_pretty_table([[1, 2], [3, 4]], ['header 1', 'header 2'])

出力

-----------------
|header 1|header 2|
-----------------
|1       |2       |
|3       |4       |
-----------------

1
output += '|' + ''.join([h + ' ' * (l - len(h)) + '|' for h, l in zip(header, max_len)]) + '\n' 区切り行ではなく、各列の間にスペースを追加します 。その行を次-のような単純なもの で拡張できますoutput = '-' * (sum(max_len) + 1 + len(header)) + '\n'
ochawkeye 2016年

1

これが私の解決策です:

def make_table(columns, data):
    """Create an ASCII table and return it as a string.

    Pass a list of strings to use as columns in the table and a list of
    dicts. The strings in 'columns' will be used as the keys to the dicts in
    'data.'

    Not all column values have to be present in each data dict.

    >>> print(make_table(["a", "b"], [{"a": "1", "b": "test"}]))
    | a | b    |
    |----------|
    | 1 | test |
    """
    # Calculate how wide each cell needs to be
    cell_widths = {}
    for c in columns:
        values = [str(d.get(c, "")) for d in data]
        cell_widths[c] = len(max(values + [c]))

    # Used for formatting rows of data
    row_template = "|" + " {} |" * len(columns)

    # CONSTRUCT THE TABLE

    # The top row with the column titles
    justified_column_heads = [c.ljust(cell_widths[c]) for c in columns]
    header = row_template.format(*justified_column_heads)
    # The second row contains separators
    sep = "|" + "-" * (len(header) - 2) + "|"
    # Rows of data
    rows = []
    for d in data:
        fields = [str(d.get(c, "")).ljust(cell_widths[c]) for c in columns]
        row = row_template.format(*fields)
        rows.append(row)

    return "\n".join([header, sep] + rows)

1
from sys import stderr, stdout    
def create_table(table: dict, full_row: bool = False) -> None:

        min_len = len(min((v for v in table.values()), key=lambda q: len(q)))
        max_len = len(max((v for v in table.values()), key=lambda q: len(q)))

        if min_len < max_len:
            stderr.write("Table is out of shape, please make sure all columns have the same length.")
            stderr.flush()
            return

        additional_spacing = 1

        heading_separator = '| '
        horizontal_split = '| '

        rc_separator = ''
        key_list = list(table.keys())
        rc_len_values = []
        for key in key_list:
            rc_len = len(max((v for v in table[key]), key=lambda q: len(str(q))))
            rc_len_values += ([rc_len, [key]] for n in range(len(table[key])))

            heading_line = (key + (" " * (rc_len + (additional_spacing + 1)))) + heading_separator
            stdout.write(heading_line)

            rc_separator += ("-" * (len(key) + (rc_len + (additional_spacing + 1)))) + '+-'

            if key is key_list[-1]:
                stdout.flush()
                stdout.write('\n' + rc_separator + '\n')

        value_list = [v for vl in table.values() for v in vl]

        aligned_data_offset = max_len

        row_count = len(key_list)

        next_idx = 0
        newline_indicator = 0
        iterations = 0

        for n in range(len(value_list)):
            key = rc_len_values[next_idx][1][0]
            rc_len = rc_len_values[next_idx][0]

            line = ('{:{}} ' + " " * len(key)).format(value_list[next_idx], str(rc_len + additional_spacing)) + horizontal_split

            if next_idx >= (len(value_list) - aligned_data_offset):
                next_idx = iterations + 1
                iterations += 1
            else:
                next_idx += aligned_data_offset

            if newline_indicator >= row_count:
                if full_row:
                    stdout.flush()
                    stdout.write('\n' + rc_separator + '\n')
                else:
                    stdout.flush()
                    stdout.write('\n')

                newline_indicator = 0

            stdout.write(line)
            newline_indicator += 1

        stdout.write('\n' + rc_separator + '\n')
        stdout.flush()

例:

table = {
        "uid": ["0", "1", "2", "3"],
        "name": ["Jon", "Doe", "Lemma", "Hemma"]
    }

create_table(table)

出力:

uid   | name       | 
------+------------+-
0     | Jon        | 
1     | Doe        | 
2     | Lemma      | 
3     | Hemma      | 
------+------------+-

2
説明を追加することで、コードのみの回答を改善できます。
Yunnosch 2017

0

これは、リストと文字列の内包表記を使用して、組み込みモジュールのみでかなりコンパクトに実行できます。すべて同じ形式の辞書のリストを受け入れます...

def tableit(dictlist):
    lengths = [ max(map(lambda x:len(x.get(k)), dictlist) + [len(k)]) for k in dictlist[0].keys() ]
    lenstr = " | ".join("{:<%s}" % m for m in lengths)
    lenstr += "\n"

    outmsg = lenstr.format(*dictlist[0].keys())
    outmsg += "-" * (sum(lengths) + 3*len(lengths))
    outmsg += "\n"
    outmsg += "".join(
        lenstr.format(*v) for v in [ item.values() for item in dictlist ]
    )
    return outmsg
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.