使用Elixir的进程字典实现线程本地存储而不引入全局状态

一、啥是线程本地存储和进程字典

在编程的世界里，有时候我们需要在一个线程或者进程里存储一些特定的数据，这些数据只在当前的线程或者进程里有用，不会影响到其他的线程或者进程。这就好比每个人都有自己的小秘密本子，里面记着只有自己知道的事儿，别人看不到也影响不了。这就是线程本地存储的概念。

而在 Elixir 这个编程语言里，有个东西叫进程字典。进程字典就像是每个进程自己的小仓库，进程可以往里面放东西，也可以从里面拿东西，而且这个仓库是每个进程独有的，别的进程进不去。

二、为啥要实现线程本地存储而不引入全局状态

全局状态就像是一个大家都能随便动的公共仓库，很多人都能往里面放东西、拿东西。这样虽然方便，但是也容易出问题。比如说，一个人放进去的东西可能被另一个人不小心改了或者拿走了，这就会导致程序出现一些莫名其妙的错误，而且很难找到问题出在哪儿。

而线程本地存储就不一样了，每个线程或者进程都有自己的小仓库，自己管理自己的东西，不会影响到别人，也不会被别人影响。这样程序就会更稳定，也更容易调试。

三、Elixir 里怎么用进程字典实现线程本地存储

1. 基本操作

在 Elixir 里，我们可以使用 Process.put/2 和 Process.get/1 这两个函数来操作进程字典。Process.put/2 用来往进程字典里放东西，Process.get/1 用来从进程字典里拿东西。下面是一个简单的示例：

# 技术栈：Elixir
# 往进程字典里放一个键值对，键是 :user_id，值是 123
Process.put(:user_id, 123)

# 从进程字典里获取键为 :user_id 的值
user_id = Process.get(:user_id)
IO.puts("User ID: #{user_id}")  # 输出 User ID: 123

2. 多进程示例

为了更好地理解进程字典的独立性，我们来看一个多进程的示例。在 Elixir 里，我们可以使用 spawn/1 函数来创建新的进程。

# 技术栈：Elixir
# 定义一个函数，用于在新进程里操作进程字典
defmodule ProcessDictExample do
  def run do
    # 创建一个新进程
    spawn(fn ->
      # 往新进程的进程字典里放一个键值对
      Process.put(:message, "Hello from new process!")
      # 从新进程的进程字典里获取值
      message = Process.get(:message)
      IO.puts(message)  # 输出 Hello from new process!
    end)

    # 在当前进程里操作进程字典
    Process.put(:message, "Hello from main process!")
    message = Process.get(:message)
    IO.puts(message)  # 输出 Hello from main process!
  end
end

# 调用 run 函数
ProcessDictExample.run()

从这个示例可以看出，新进程和当前进程的进程字典是相互独立的，它们可以存储不同的值，不会相互影响。

四、应用场景

1. 记录用户信息

在一个 Web 应用里，每个用户的请求可能会在不同的进程里处理。我们可以使用进程字典来记录每个用户的信息，比如用户 ID、用户名等。这样，在处理用户请求的过程中，我们可以随时从进程字典里获取用户信息，而不用担心会和其他用户的信息混淆。

# 技术栈：Elixir
defmodule UserHandler do
  def handle_request(user_id) do
    # 往进程字典里放用户 ID
    Process.put(:user_id, user_id)

    # 模拟处理请求
    IO.puts("Processing request for user #{user_id}")

    # 从进程字典里获取用户 ID
    user_id_from_dict = Process.get(:user_id)
    IO.puts("User ID from dict: #{user_id_from_dict}")
  end
end

# 模拟处理两个不同用户的请求
UserHandler.handle_request(1)
UserHandler.handle_request(2)

2. 日志记录

在一个复杂的程序里，我们可能需要记录一些特定的信息，比如某个函数的执行时间、某个操作的结果等。使用进程字典可以方便地在不同的函数里记录和获取这些信息，而不会影响到其他进程。

# 技术栈：Elixir
defmodule LoggerExample do
  def log_info(key, value) do
    # 往进程字典里放日志信息
    Process.put(key, value)
  end

  def get_log_info(key) do
    # 从进程字典里获取日志信息
    Process.get(key)
  end

  def process_data do
    # 记录开始时间
    start_time = System.monotonic_time(:millisecond)
    log_info(:start_time, start_time)

    # 模拟处理数据
    :timer.sleep(2000)

    # 记录结束时间
    end_time = System.monotonic_time(:millisecond)
    log_info(:end_time, end_time)

    # 计算执行时间
    execution_time = end_time - start_time
    log_info(:execution_time, execution_time)

    # 输出日志信息
    IO.puts("Start time: #{get_log_info(:start_time)}")
    IO.puts("End time: #{get_log_info(:end_time)}")
    IO.puts("Execution time: #{get_log_info(:execution_time)} ms")
  end
end

# 调用 process_data 函数
LoggerExample.process_data()

五、技术优缺点

优点

独立性：每个进程都有自己独立的进程字典，不会相互影响，这样可以避免全局状态带来的问题，提高程序的稳定性和可维护性。
方便性：使用 Process.put/2 和 Process.get/1 函数可以很方便地操作进程字典，不需要复杂的代码。
灵活性：进程字典可以存储任意类型的数据，比如整数、字符串、列表等，非常灵活。

缺点

数据共享困难：由于每个进程的进程字典是独立的，如果需要在不同的进程之间共享数据，就会比较麻烦。
内存占用：如果每个进程都存储大量的数据，会占用较多的内存，尤其是在进程数量较多的情况下。

六、注意事项

数据生命周期：进程字典里的数据只在当前进程的生命周期内有效。当进程结束时，进程字典里的数据也会被销毁。
并发问题：虽然进程字典是每个进程独有的，但是在多进程环境下，仍然需要注意并发问题。比如，在一个进程里修改进程字典里的数据时，可能会影响到该进程里其他函数的执行结果。
命名冲突：在使用进程字典时，要注意键的命名，避免出现命名冲突。可以使用一些有意义的命名规则，比如加上模块名或者功能名。

七、文章总结

通过使用 Elixir 的进程字典，我们可以很方便地实现线程本地存储，而不引入全局状态。进程字典为每个进程提供了一个独立的存储空间，使得每个进程可以管理自己的数据，避免了全局状态带来的问题。在实际应用中，进程字典可以用于记录用户信息、日志记录等场景。然而，我们也需要注意进程字典的一些缺点和注意事项，比如数据共享困难、内存占用和并发问题等。总之，合理使用进程字典可以提高程序的稳定性和可维护性。

敲码拾光专注于编程技术，涵盖编程语言、代码实战案例、软件开发技巧、IT前沿技术、编程开发工具，是您提升技术能力的优质网络平台。