当前位置:Gxlcms > html代码 > 如何用程序解图片迷宫?

如何用程序解图片迷宫?

时间:2021-07-01 10:21:17 帮助过:10人阅读

 英文原文:Representing and solving a maze given an image

  译注:原文是 StackOverflow 上一个如何用程序读取迷宫图片并求解的问题,几位参与者热烈地讨论并给出了自己的代码,涉及到用 Python 对图片的处理以及广度优先(BFS)算法等。

  问题 by Whymarrh:

1116.jpg

当给定上面那样一张 JPEG 图片,如何才能更好地将这张图转换为合适的数据结构并且解出这个迷宫?

  我的第一直觉是将这张图按像素逐个读入,并存储在一个包含布尔类型元素的列表或数组中,其中 True 代表白色像素,False 代表非白色像素(或彩色可以被处理成二值图像)。但是这种做法存在一个问题,那就是给定的图片往往并不能完美的“像素化”。考虑到如果因为图片转换的原因,某个非预期的白色像素出现在迷宫的墙上,那么就可能会创造出一一条非预期的路径。

  经过思考之后,我想出了另一种方法:首先将图片转换为一个可缩放适量图形(SVG)文件,这个文件由一个画布上的矢量线条列表组成,矢量线条按照列表的顺序读取,读取出的仍是布尔值:其中 True 表示墙,而 False 表示可通过的区域。但是这种方法如果无法保证图像能够做到百分之百的精确转换,尤其是如果不能将墙完全准确的连接,那么这个迷宫就可能出现裂缝。

  图像转换为 SVG 的另一个问题是,线条并不是完美的直线。因为 SVG 的线条是三次贝塞尔曲线,而使用整数索引的布尔值列表增加了曲线转换的难度,迷宫线条上的所有点在曲线上都必须经过计算,但不一定能够完美对应列表中的索引值。

  假设以上方法的确可以实现(虽然很可能都不行),但当给定一张很大的图像时,它们还是不能胜任。那么是否存在一种更好地方法能够平衡效率和复杂度?

  这就要讨论到如何解迷宫了。如果我使用以上两种方法中的任意一种,我最终将会得到一个矩阵。而根据这个问答(http://stackoverflow.com/questions/3097556/programming-theory-solve-a-maze/3097677#3097677),一个比较好的迷宫表示方式应该是使用树的结构,并且使用A*搜索算法来解迷宫。那么如何从迷宫图片中构造出迷宫树呢?有比较好的方法么?

  以上废话太多,总结起来问题就是:如何转换迷宫图片?转换成为什么样的数据结构?采用什么样的数据结构能够帮助或阻碍解迷宫?

  回答 by Mikhail:

  这是我的解决方案:

  1. 将图片转换为灰度图像(不是直接二值),调整不同颜色的权重使得最终的灰度看起来比较统一,你可以通过简单地调节 Photoshop 图像->调整->黑白菜单中的控制条来实现。

  2. 将上一步得到的灰度图片转换为二值图片,可以通过在 PS 图像->调整->阈值菜单中设定适当的阈值来实现

  3. 确保正确设置了阈值。使用魔棒工具(参数设置:容差 0、取样点、连续以及消除锯齿)选择空白区域,检查所选区域的边缘不是因为错误的阈值设置而产生的假边缘。事实上,这个迷宫中从 start 到 end 应该由联通的空白区域。

  4. 人为地在迷宫外部加上边界,确保迷宫漫游者^_^不会从 start 绕着迷宫跑到终点。:)

  5. 选择语言实现广度优先搜索算法(BFS),从 start 处开始让程序运行。下面的代码我选择用 Matlab 实现。正如 Thomas 提到的,没必要纠结于图像的表示形式,你可以直接在二值图像上运行。

  以下是用 MATLAB 实现的 BFS 代码:

  1. function path = solve_maze(img_file)
  2. %% Init data
  3. img = imread(img_file);
  4. img = rgb2gray(img);
  5. maze = img > 0;
  6. start = [985 398];
  7. finish = [26 399];
  8. %% Init BFS
  9. n = numel(maze);
  10. Q = zeros(n, 2);
  11. M = zeros([size(maze) 2]);
  12. front = 0;
  13. back = 1;
  14. function push(p, d)
  15. q = p + d;
  16. if maze(q(1), q(2)) && M(q(1), q(2), 1) == 0
  17. front = front + 1;
  18. Q(front, :) = q;
  19. M(q(1), q(2), :) = reshape(p, [1 1 2]);
  20. end
  21. end
  22. push(start, [0 0]);
  23. d = [0 1; 0 -1; 1 0; -1 0];
  24. %% Run BFS
  25. while back <= front
  26. p = Q(back, :);
  27. back = back + 1;
  28. for i = 1:4
  29. push(p, d(i, :));
  30. end
  31. end
  32. %% Extracting path
  33. path = finish;
  34. while true
  35. q = path(end, :);
  36. p = reshape(M(q(1), q(2), :), 1, 2);
  37. path(end + 1, :) = p;
  38. if isequal(p, start)
  39. break;
  40. end
  41. end
  42. end


这是个简单的实现,应该很容易就能够改写为 Python 或其他语言,下面是程序的运行结果:

1117.jpg

提问者更新:

  我用 Python 实现了一下 Mikhail 的方法,其中用到了 numpy 库,感谢 Thomas 推荐。我感觉这个算法是正确的,但是效果不太如预期,以下是相关代码,使用了 PyPNG 库处理图片。

  译注:很遗憾,我用提问者提供的代码并没有跑通程序,并且似乎代码缩进有点问题,而下面其他参与者的代码能够执行通过,并且效果很好。

  1. import png, numpy, Queue, operator, itertools
  2. def is_white(coord, image):
  3. """ Returns whether (x, y) is approx. a white pixel."""
  4. a = True
  5. for i in xrange(3):
  6. if not a: break
  7. a = image[coord[1]][coord[0] * 3 + i] > 240
  8. return a
  9. def bfs(s, e, i, visited):
  10. """ Perform a breadth-first search. """
  11. frontier = Queue.Queue()
  12. while s != e:
  13. for d in [(-1, 0), (0, -1), (1, 0), (0, 1)]:
  14. np = tuple(map(operator.add, s, d))
  15. if is_white(np, i) and np not in visited:
  16. frontier.put(np)
  17. visited.append(s)
  18. s = frontier.get()
  19. return visited
  20. def main():
  21. r = png.Reader(filename = "thescope-134.png")
  22. rows, cols, pixels, meta = r.asDirect()
  23. assert meta['planes'] == 3 # ensure the file is RGB
  24. image2d = numpy.vstack(itertools.imap(numpy.uint8, pixels))
  25. start, end = (402, 985), (398, 27)
  26. print bfs(start, end, image2d, [])

 回答 by Joseph Kern:

  1. #!/usr/bin/env python
  2. import sys
  3. from Queue import Queue
  4. from PIL import Image
  5. start = (400,984)
  6. end = (398,25)
  7. def iswhite(value):
  8. if value == (255,255,255):
  9. return True
  10. def getadjacent(n):
  11. x,y = n
  12. return [(x-1,y),(x,y-1),(x+1,y),(x,y+1)]
  13. def BFS(start, end, pixels):
  14. queue = Queue()
  15. queue.put([start]) # Wrapping the start tuple in a list
  16. while not queue.empty():
  17. path = queue.get()
  18. pixel = path[-1]
  19. if pixel == end:
  20. return path
  21. for adjacent in getadjacent(pixel):
  22. x,y = adjacent
  23. if iswhite(pixels[x,y]):
  24. pixels[x,y] = (127,127,127) # see note
  25. new_path = list(path)
  26. new_path.append(adjacent)
  27. queue.put(new_path)
  28. print "Queue has been exhausted. No answer was found."
  29. if __name__ == '__main__':
  30. # invoke: python mazesolver.py [.jpg|.png|etc.]
  31. base_img = Image.open(sys.argv[1])
  32. base_pixels = base_img.load()
  33. path = BFS(start, end, base_pixels)
  34. path_img = Image.open(sys.argv[1])
  35. path_pixels = path_img.load()
  36. for position in path:
  37. x,y = position
  38. path_pixels[x,y] = (255,0,0) # red
  39. path_img.save(sys.argv[2])


动态执行效果:

回答 by Jim

  使用树搜索太繁杂了,迷宫本身就跟解路径是可分的。正因如此,你可以使用连通区域查找算法来标记迷宫中的连通区域,这将迭代搜索两次这些像素点。如果你想要更好地解决方法,你可以对结构单元使用二元运算(binary operations)来填充每个连通区域中的死路。

  下面是相关的 MATLAB 代码及运行结果:

  1. % read in and invert the image
  2. im = 255 - imread('maze.jpg');
  3. % sharpen it to address small fuzzy channels
  4. % threshold to binary 15%
  5. % run connected components
  6. result = bwlabel(im2bw(imfilter(im,fspecial('unsharp')),0.15));
  7. % purge small components (e.g. letters)
  8. for i = 1:max(reshape(result,1,1002*800))
  9. [count,~] = size(find(result==i));
  10. if count < 500
  11. result(result==i) = 0;
  12. end
  13. end
  14. % close dead-end channels
  15. closed = zeros(1002,800);
  16. for i = 1:max(reshape(result,1,1002*800))
  17. k = zeros(1002,800);
  18. k(result==i) = 1; k = imclose(k,strel('square',8));
  19. closed(k==1) = i;
  20. end
  21. % do output
  22. out = 255 - im;
  23. for x = 1:1002
  24. for y = 1:800
  25. if closed(x,y) == 0
  26. out(x,y,:) = 0;
  27. end
  28. end
  29. end
  30. imshow(out);

1118.jpg

回答 by Stefano

  stefano 童鞋给出了生成搜索过程 GIF 及 AVI 文件的代码 maze-solver-python (GitHub)

以上就是如何用程序解图片迷宫的内容,更多相关内容请关注PHP中文网(www.gxlcms.com)!

人气教程排行