halowang1991
V2EX  ›  问与答

macOS 技术栈下有什么可以高效的获取屏幕上内容的方法吗?

  •  
  •   halowang1991 · May 28, 2024 · 1366 views
    This topic created in 734 days ago, the information mentioned may be changed or developed.

    我在做一款 App ,我希望能截取整个屏幕后进行 OCR 功能。也就是说包括其他任意 App (进程)

    我之前的做法是:

    1. 在光标周围置顶范围内截取屏幕
    2. 将截取的图片进行 OCR
    3. 每秒重复若干次上述操作

    但是,总是截取鼠标附近的区域,获取的信息量太少。如果截取整个屏幕,电脑性能又吃不消

    有什么开箱即用的,实时性高的 framework 可以解决这个问题吗?

    在我看来,这个似乎有点像是实时语义分割?

    No Comments Yet
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   963 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 5414617a · 26ms · UTC 20:43 · PVG 04:43 · LAX 13:43 · JFK 16:43
    ♥ Do have faith in what you're doing.