Pythonで特定のピクセルのRGB値を読み取る方法は?


140

で画像を開いた場合open("image.jpg")、ピクセルの座標があると仮定して、ピクセルのRGB値を取得するにはどうすればよいですか?

次に、これを逆にするにはどうすればよいですか?空白のグラフィックから始めて、特定のRGB値でピクセルを「書き込み」ますか?

追加のライブラリをダウンロードする必要がない場合は、こちらをお勧めします。

回答:


213

これを行うには、Pythonイメージライブラリを使用するのがおそらく最善です。

必要なことを行う最も簡単な方法は、配列のように操作できるピクセルアクセスオブジェクトを返すImageオブジェクトload()メソッドを使用することです。

from PIL import Image

im = Image.open('dead_parrot.jpg') # Can be many different formats.
pix = im.load()
print im.size  # Get the width and hight of the image for iterating over
print pix[x,y]  # Get the RGBA Value of the a pixel of an image
pix[x,y] = value  # Set the RGBA Value of the image (tuple)
im.save('alive_parrot.png')  # Save the modified pixels as .png

または、画像を作成するためのより豊富なAPIを提供するImageDrawを見てください。


1
幸運なことに、PILのインストールはLinuxとWindowsでは非常に簡単です(Macについては知らない)
heltonbiker

6
@ArturSapek、私はPILをインストールしましpipた。
michaelliu 2013

1
私はこれをMac(Pypi)で使用しました:easy_install --find-links http://www.pythonware.com/products/pil/ Imaging
Mazyod

15
将来の読者のために:pip install pillowPILをかなり迅速に正常にインストールします(sudovirtualenvにない場合は必要になる場合があります)。
Christopher Shroba 2015

pillow.readthedocs.io/en/latest/…は、Windowsのインストール手順におけるbashコマンドを示しています。どうすればよいかわからない。
Musixauce3000 2016年

31

(Python 3.XとPython 2.7+で動作する)Pillowを使用すると、次のことができます。

from PIL import Image
im = Image.open('image.jpg', 'r')
width, height = im.size
pixel_values = list(im.getdata())

これですべてのピクセル値が得られました。RGBか別のモードの場合は、で読み取ることができますim.mode。次に、次の方法でピクセルを取得できます(x, y)

pixel_values[width*y+x]

または、Numpyを使用して配列の形状を変更することもできます。

>>> pixel_values = numpy.array(pixel_values).reshape((width, height, 3))
>>> x, y = 0, 1
>>> pixel_values[x][y]
[ 18  18  12]

完全で使いやすいソリューションは

# Third party modules
import numpy
from PIL import Image


def get_image(image_path):
    """Get a numpy array of an image so that one can access values[x][y]."""
    image = Image.open(image_path, "r")
    width, height = image.size
    pixel_values = list(image.getdata())
    if image.mode == "RGB":
        channels = 3
    elif image.mode == "L":
        channels = 1
    else:
        print("Unknown mode: %s" % image.mode)
        return None
    pixel_values = numpy.array(pixel_values).reshape((width, height, channels))
    return pixel_values


image = get_image("gradient.png")

print(image[0])
print(image.shape)

コードを煙でテスト

幅、高さ、チャネルの順序がわからない場合があります。このため、このグラデーションを作成しました。

ここに画像の説明を入力してください

画像の幅は100px、高さは26pxです。#ffaa00(黄色)から#ffffff(白)への色のグラデーションがあります。出力は次のとおりです。

[[255 172   5]
 [255 172   5]
 [255 172   5]
 [255 171   5]
 [255 172   5]
 [255 172   5]
 [255 171   5]
 [255 171   5]
 [255 171   5]
 [255 172   5]
 [255 172   5]
 [255 171   5]
 [255 171   5]
 [255 172   5]
 [255 172   5]
 [255 172   5]
 [255 171   5]
 [255 172   5]
 [255 172   5]
 [255 171   5]
 [255 171   5]
 [255 172   4]
 [255 172   5]
 [255 171   5]
 [255 171   5]
 [255 172   5]]
(100, 26, 3)

注意事項:

  • 形状は(幅、高さ、チャネル)
  • image[0]、したがって最初の行は、同じ色の26のトリプルを有します

Pillowはmacosxでpython 2.7をサポートしていますが、PILではPython 2.5しかサポートしていません。ありがとう!
Kangaroo.H 2017年

2
注意してください、 'reshape' paramsリストは(高さ、幅、チャネル)でなければなりません。rgbaイメージの場合、image.mode = RGBA with channels = 4
gmarsi

幅と高さの@gmarsiによるポイントは正しいですか?どちらも有効ですか?データがどのように出力されるかを知っておく必要があるので、出力配列の形状と、画像の行と列のピクセルデータがどこにあるかがわかります。
きのしき

@Kioshikiわかりやすいように「煙のテスト」セクションを追加しました。
Martin Thoma

24

PyPNG-軽量のPNGデコーダー/エンコーダー

質問はJPGを示唆していますが、私の回答が一部の人々に役立つことを願っています。

PyPNGモジュールを使用してPNGピクセルを読み書きする方法は次のとおりです

import png, array

point = (2, 10) # coordinates of pixel to be painted red

reader = png.Reader(filename='image.png')
w, h, pixels, metadata = reader.read_flat()
pixel_byte_width = 4 if metadata['alpha'] else 3
pixel_position = point[0] + point[1] * w
new_pixel_value = (255, 0, 0, 0) if metadata['alpha'] else (255, 0, 0)
pixels[
  pixel_position * pixel_byte_width :
  (pixel_position + 1) * pixel_byte_width] = array.array('B', new_pixel_value)

output = open('image-with-red-dot.png', 'wb')
writer = png.Writer(w, h, **metadata)
writer.write_array(output, pixels)
output.close()

PyPNGは、テストとコメントを含む、4000行未満の単一の純粋なPythonモジュールです。

PILはより包括的なイメージングライブラリですが、それよりもかなり重いです。


12

デイブ・ウェッブが言ったように:

これは、画像からピクセル色を印刷する私の作業コードスニペットです。

import os, sys
import Image

im = Image.open("image.jpg")
x = 3
y = 4

pix = im.load()
print pix[x,y]

6
photo = Image.open('IN.jpg') #your image
photo = photo.convert('RGB')

width = photo.size[0] #define W and H
height = photo.size[1]

for y in range(0, height): #each pixel has coordinates
    row = ""
    for x in range(0, width):

        RGB = photo.getpixel((x,y))
        R,G,B = RGB  #now you can use the RGB value

3

画像操作は複雑なトピックであり、あなたがあれば、それが最善だ行うライブラリを使用します。Python内からさまざまな画像フォーマットに簡単にアクセスできるgdmoduleをお勧めします。


なぜこれが反対投票されたのか誰でも知っていますか?libgdなどに既知の問題はありますか?(私は一度も見たことがありませんでしたが、PiLに代わるものがあることを知っておくのはいつもうれしいことです)
Peter Hanley

3

Wiki.wxpython.orgに、「画像の操作」というタイトルの本当に良い記事があります。この記事では、wxWidgets(wxImage)、PIL、またはPythonMagickを使用できる可能性について言及しています。個人的には、PILとwxWidgetsを使用しており、どちらも画像の操作をかなり簡単にしています。


3

pygameのsurfarrayモジュールを使用できます。このモジュールには、pixels3d(surface)というメソッドを返す3dピクセル配列があります。以下に使用方法を示しました。

from pygame import surfarray, image, display
import pygame
import numpy #important to import

pygame.init()
image = image.load("myimagefile.jpg") #surface to render
resolution = (image.get_width(),image.get_height())
screen = display.set_mode(resolution) #create space for display
screen.blit(image, (0,0)) #superpose image on screen
display.flip()
surfarray.use_arraytype("numpy") #important!
screenpix = surfarray.pixels3d(image) #pixels in 3d array:
#[x][y][rgb]
for y in range(resolution[1]):
    for x in range(resolution[0]):
        for color in range(3):
            screenpix[x][y][color] += 128
            #reverting colors
screen.blit(surfarray.make_surface(screenpix), (0,0)) #superpose on screen
display.flip() #update display
while 1:
    print finished

お役に立てば幸いです。最後の言葉:画面はscreenpixの寿命の間ロックされます。


2

コマンド「sudo apt-get install python-imaging」を使用してPILをインストールし、次のプログラムを実行します。画像のRGB値を出力します。画像が大きい場合、「>」を使用して出力をファイルにリダイレクトし、後でファイルを開いてRGB値を確認します

import PIL
import Image
FILENAME='fn.gif' #image can be in gif jpeg or png format 
im=Image.open(FILENAME).convert('RGB')
pix=im.load()
w=im.size[0]
h=im.size[1]
for i in range(w):
  for j in range(h):
    print pix[i,j]

2

Tk GUIツールキットへの標準PythonインターフェースであるTkinterモジュールを使用でき、追加のダウンロードは必要ありません。https://docs.python.org/2/library/tkinter.htmlを参照してください

(Python 3の場合、Tkinterはtkinterに名前が変更されました)

RGB値を設定する方法は次のとおりです。

#from http://tkinter.unpythonic.net/wiki/PhotoImage
from Tkinter import *

root = Tk()

def pixel(image, pos, color):
    """Place pixel at pos=(x,y) on image, with color=(r,g,b)."""
    r,g,b = color
    x,y = pos
    image.put("#%02x%02x%02x" % (r,g,b), (y, x))

photo = PhotoImage(width=32, height=32)

pixel(photo, (16,16), (255,0,0))  # One lone pixel in the middle...

label = Label(root, image=photo)
label.grid()
root.mainloop()

そしてRGBを取得します。

#from http://www.kosbie.net/cmu/spring-14/15-112/handouts/steganographyEncoder.py
def getRGB(image, x, y):
    value = image.get(x, y)
    return tuple(map(int, value.split(" ")))

2
from PIL import Image
def rgb_of_pixel(img_path, x, y):
    im = Image.open(img_path).convert('RGB')
    r, g, b = im.getpixel((x, y))
    a = (r, g, b)
    return a

1
このコードスニペットが解決策となる可能性がありますが、説明を含めると、投稿の品質を向上させるのに役立ちます。あなたは将来の読者のための質問に答えていることを覚えておいてください、そしてそれらの人々はあなたのコード提案の理由を知らないかもしれません。
Narendra Jadhav

1
import matplotlib.pyplot as plt
import matplotlib.image as mpimg

img=mpimg.imread('Cricket_ACT_official_logo.png')
imgplot = plt.imshow(img)

1

RGBカラーコードの形式で3桁を使用する場合は、次のコードでそれを実行できます。

i = Image.open(path)
pixels = i.load() # this is not a list, nor is it list()'able
width, height = i.size

all_pixels = []
for x in range(width):
    for y in range(height):
        cpixel = pixels[x, y]
        all_pixels.append(cpixel)

これはあなたのために働くかもしれません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.