Lịch sử của option pricing: trang 5 cuốn sách Wim Schoutens(auth.), Walter A. Shewhart, Samuel S. Wilks(eds.)-Levy Processes in Finance_ Pricing Financial Derivatives (2003)
John von Neumann Institute radio
Một trang web hay về toán tài chính link
Blog hay về toán tài chính www.vnquants.com toantaichinhblog.wordpress.com
Violet của Trương Văn Kìm link
Cập nhật tình hình tài chính thế giới finance.yahoo.com/news
General background of option pricing
Xác suất thống kê đóng vai trò rất quan trọng trong tài chính. Cuốn sách sau của giáo sư Nguyễn Tiến Dũng và Đỗ Đức Thái là một nguồn tham khảo quý giá để nắm được những kiến thức cơ bản của XSTK. Cuốn sách này được cung cấp miễn phí ở shop.sputnikedu.com
The intuition behind the Black-Scholes option pricing formula
A simple explanation of the Black-Scholes formula
Good course about Option pricing taught by Campbell Harvey
Bàn về Wilmott book
I am going to do research with Dr. Duy Minh Dang on pricing American barrier options with jumps. I need to understand why it is reasonable to have jumps in the asset pricing models.
09/05/2016
I am reading the paper "A Fourier transform analysis of the American call option on assets driven by jump-diffusion processes" written by Carl Chiarella and his PhD student Andrew Ziogas. To understand the reason why we should include jumps in the pricing models, I need to read more literature.
Merton (1976) " Option pricing when underlying stock returns are discontinuous" described in details the reasons. This is a very good paper.
"In their classic paper on the theory of option pricing, Black-Scholes present a mode of analysis that has revolutionised the theory of corporate liability pricing. In part, their approach was a breakthrough because it leads to pricing formulas, for the most part, using only observable variables: the current asset price, the interest rate, the dividend rate, the current time, .... In particular, their formulas do not require knowledge of either investors' tastes or their beliefs about expected returns on the underlying common stock. Moreover, under specific posited conditions, their formula most hold to avoid the creation of arbitrage possibilities.
As was pointed out in Merton, the critical assumptions in the Black-Scholes derivation is that trading takes place continuously in time and that the price dynamics of the stock have a continuous sample path with probability one.
The Black-Scholes solution is not valid when the stock price dynamics cannot be represented by a stochastic process with a continuous sample path. In essence, the validity of the Black-Scholes formula depends on whether stock price changes satisfy a kind of "local" Markov property, i.e., in a short interval of time, the stock price can only change by a small amount.
The antipathetic process to this continuous stock price motion would be a "jump" stochastic process defined in continuous time. In essence, such a process allows for a positive probability of a stock price change of extraordinary magnitude, no matter how small the time interval between successive observation. Indeed, there are many empirical evidence for the existence of such jumps. On a less scientific basis, we have all observed price changes in stocks (usually in response to some announcement) which, at least on the surface, appear to be "jump".
The total change in the stock price is posited to be composition of two types of changes: (1) the normal vibrations in price, for examples, due to a temporary imbalance between supply and demand, changes in capitalisation rates, changes in the economic outlook, ore other new information that causes marginal changes in the stock's value. In essence, the impact of such information per unit time on the stock price is to produce a marginal change in the price (almost certainly). This component is modelled by a standard geometric Brownian motion with a constant variance per unit time and it has a continuous sample path. (2) the "abnormal" vibrations in price are due to the arrival of important new information about the stock that has more than a marginal effect on price. Usually, such information will be specific to the firm or possibly its industry. It is reasonable to expect that there will be "active" times in the stock when such information arrives and "quite" times although the "active" and "quite" times are random. By its very nature, important information arrives only at discrete points in time. This component is modelled by a "jump" process reflecting the non-marginal impact of the information.
15/09/2016
The following questions can be written in the form of small interesting research projects?
1. What is jump-diffusion processes?
One of great books about introducing Poisson processes is (Springer Texts in Statistics) V. G. Kulkarni (auth.)-Introduction to Modeling and Analysis of Stochastic Systems-Springer New York (2011), Sheldon M. Ross-Introduction to Probability Models, Tenth Edition (2009)
2. What is a homogeneous integro-partial differential equation? How do we solve this IPDE analytically and numerically?
3. How do we price European vanilla options under Merton jump-process?
Chapter 10 of Financial Modeling With Jump Processes is a good place to find the answer?
A pair of linked integral equations = a pair of coupled integral equations? How do we solve them numerically?
22/09/2016
Good sentences from Sheldon M. Ross-Introduction to Probability Models, Tenth Edition (2009)
Good sentences from Sheldon M. Ross-Introduction to Probability Models, Tenth Edition (2009)
Page 291 "In making a mathematical model for a real-world phenomenon it is always necessary to make certain simplifying assumptions so as to render the mathematics tractable. On the other hand, however, we cannot make too many simplifying assumptions, for then our conclusions, obtained from the mathematical model, would not be applicable to the real-world situation. Thus, in short, we must
make enough simplifying assumptions to enable us to handle the mathematics but not so many that the mathematical model no longer resembles the real-world phenomenon. One simplifying assumption that is often made is to assume that certain random variables are exponentially distributed. The reason for this is that the exponential distribution is both relatively easy to work with and is often a good approximation to the actual distribution."
"The property of the exponential distribution that makes it easy to analyze is that it does not deteriorate with time. By this we mean that if the lifetime of an item is exponentially distributed, then an item that has been in use for ten (or any number of) hours is as good as a new item in regards to the amount of time remaining until the item fails. This will be formally defined in Section 5.2 where
it will be shown that the exponential is the only distribution that possesses this property."
1. What is a stochastic process (quá trình ngẫu nhiên)? (see chapter 1 of Financial Modeling With Jump Processes)
Một quá trình ngẫu nhiên là một mô hình xác suất mô tả quá trình biến đổi ngẫu nhiên của một hệ thống (hệ thống ở đây hiểu theo nghĩa rộng nhất có thể, chẳng hạn thời tiết của một vùng, hệ thống chứng khoán, ....). Nếu ta quan sát hệ thống tại các thời điểm rời rạc, chẳng hạn vào cuối mỗi ngày hay mỗi giờ, thì ta thu được một quá trình ngẫu nhiên rời rạc. Còn nếu ta quan sát hệ thống một cách liên tục tại mỗi thời điểm, ta thu được một hệ thống ngẫu nhiên liên tục. Như vậy, quá trình ngẫu nhiên liên tục có thể xem là giới hạn của một quá trình ngẫu nhiên rời rạc, khi tần suất quan sát định kì tăng lên, chẳng hạn từ cuối mỗi ngày đến cuối mỗi giờ hay cuối mỗi phút, mỗi giây. Trong thực tế, ta có lẽ chỉ có các quá trình ngẫu nhiên rời rạc vì đơn vị thời gian của ta là rời rạc. Tuy nhiên, quá trình ngẫu nhiên liên tục có thể xem là sự xấp xỉ cho quá trình ngẫu nhiên trong thực tế. Với các công cụ có sẵn, quá trình tính toán trên quá trình ngẫu nhiên liên tục khá thuận lợi, kết quả thu được có thể dùng để xấp xỉ kết quả thực tế của các quá trình ngẫu nhiên rời rạc tương ứng.
Ta xét một hệ thống biến đổi ngẫu nhiên theo thời gian. Giả sử hệ thống này được quan sát tại các thời điểm rời rạc $n = 0, 1, 2, 3, ...$. Gọi $X_n$ là tình trạng của hệ thống tại thời điểm quan sát thứ $n$. Dãy các biến ngẫu nhiên (random variable) $X_0, X_1, X_2, \cdots$ được gọi là quá trình ngẫu nhiên rời rạc. Gọi $S$ là tất cả các tình trạng có thể có của hệ thống ở bất kì thời điểm nào, khi đó $S$ được gọi là không gian các tình trạng có thể có của quá trình ngẫu nhiên.
Nói nôm na, một quá trình ngẫu nhiên mô tả kết quả thu được khi quan sát một biến ngẫu nhiên theo thời gian. Hay, quá trình ngẫu nhiên là một tập hợp các biến ngẫu nhiên theo thời gian.
Ví dụ 1. Chẳng hạn ta tung một đồng xu có hai mặt sấp và ngữa, và quan sát mặt hiển thị sau khi đồng xu rơi xuống đất. Tại mỗi thời điểm ta tung đồng xu thì có tất cả 2 trường hợp xảy ra: hoặc mặt hiển thị là mặt sấp hoặc mặt ngửa. Ta biểu thị sự kiện thu được mặt sấp hoặc ngửa bằng số 1 và 2. Thao tác này chính là toán học hoá sự kiện, tức là mô tả thí nghiệm tung đồng xu dưới ngôn ngữ toán học, cụ thể là dùng biến ngẫu nhiên X để mô tả kết quả thu được. Nếu X = 1 thì ta thu được mặt sấp và nếu X = 2 thì ta thu được mặt ngửa. Ta không biết X nhận giá trị nào trước khi tung đồng xu, vì giá trị của X là ngẫu nhiên, không tuân theo công thức cố định nào cả. Đó có lẽ là lí do X được gọi là biến ngẫu nhiên.
Nếu ta xem xét các thí nghiệm tung đồng xu một cách rời rạc, không có sự liên kết về mặt thời gian thì mỗi thí nghiệm được mô tả như là một biến ngẫu nhiên. Tuy nhiên, nếu ta tiến hành thí nghiệm một cách có hệ thống theo thời gian (ghi chép kết quả thu được, so sánh sự thay đổi kết quả thu được theo thời gian, ...) và quan tâm đến quá trình thay đổi kết quả thì các thí nghiệm tung đồng xu được mô tả thông qua quá trình ngẫu nhiên.
Ví dụ 2. Chẳng hạn, ta quan tâm đến nhiệt độ lúc 12h trưa tại sân bay Đông Tác, Tuy Hoà, Phú Yên. Ta quan sát sự thay đổi nhiệt độ theo thời gian và gọi $X_n$ là nhiệt độ tại sân bay vào lúc 12 ngày thứ $n$. Quá trình theo dõi trên được mô tả bằng một quá trình ngẫu nhiên rời rạc $X_0, X_1, X_2, ....$. Nhiệt độ tại sân bay này lúc 12h trưa thường không thể dưới $-50^0 C$ hay trên $150^0C$. Nói cách khác, nhiệt độ quan sát được sẽ nằm trong đoạn $[-50^0 C, 150^0 C]$.
Ví dụ 3. Tỉ lệ lạm phát của một nền kinh tế thay đổi theo thời gian và quá trình thay đổi tỉ lệ lạm phát có thể mô tả bởi một quá trình ngẫu nhiên rời rạc (theo dõi theo từng quý).
Ví dụ 4. Giá trị một cổ phiếu thay đổi theo từng giây và quá trình thay đổi này có thể mô phỏng bởi một quá trình ngẫu nhiên liên tục.
Ví dụ 5. Một công ty bảo hiểm quan tâm đến số lượng người được bảo hiểm chi trả mỗi tuần. Số lượng này rõ ràng thay đổi theo mỗi tuần và quá trình thay đổi này có thể mô tả như là quá trình ngẫu nhiên rời rạc.
Nghiên cứu một quá trình ngẫu nhiên giúp ta có thể xác định giá trị trung bình, phân phối xác suất của biến ngẫu nhiên tại từng thời điểm. Từ đó, ta có thể dự đoán sự kiện gì có thể xảy ra, với xác suất tương ứng tại từng thời điểm. Ta cũng có thể tính giá trị trung bình, phân phối xác xuất của biến ngẫu nhiên trong một khoảng thời gian nhất định (nghiên cứu tổng các biến ngẫu nhiên tại từng thời điểm nằm trong khoảng thời gian xem xét).
Các nhà toán học đã phát triển hai lớp quá trình ngẫu nhiên đặc biệt, có thể dùng để nghiên cứu trong nhiều lĩnh vực: quá trình ngẫu nhiên Markov liên tục và rời rạc.
Bây giờ ta xét một quá trình ngẫu nhiên rời rạc và gọi $X_n$ là tình trạng của quá trình tại thời điểm thứ $n$. Giả sử thời điểm hiện tại ứng với $n = 10$, tức là ta đã quan sát được $X_0, X_1, ..., X_{10}$. Câu hỏi đặt ra là liệu ta có thể tình trạng của quá trình ở thời điểm tiếp theo ứng với $n = 11$, với xác suất tương ứng là bao nhiêu? Tổng quát, $X_{11}$ phụ thuộc vào $X_0, X_1, ..., X_{10}$. Tuy nhiên, để cho đơn giản, ta giả sử rằng $X_{11}$ chỉ phụ thuộc vào tình trạng ở thời điểm hiện tại $X_{10}$, chứ không hề phụ thuộc vào tình trạng quá khứ. Tổng quát, ta giả sử rằng $X_{n+1}$ chỉ phụ thuộc vào $X_n$, chứ không phụ thuộc vào $X_0, X_1, ..., X_{n-1}$. Một quá trình ngẫu nhiên với tính chất này được gọi là có tính Markov. Tên gọi này là để tri ân nhà toán học Andrey Markov, người đầu tiên nghiên cứu quá trình ngẫu nhiên có tính chất này, vào năm 1900.
Ta có định nghĩa tổng quát sau. Một quá trình ngẫu nhiên rời rạc Markov thoả mãn $$P(X_{n+1} = j|X_n = i, X_{n-1}, ..., X_0)=P(X_{n+1} = j|X_n = i).$$ Quá trình ngẫu nhiên này được gọi là thuần nhất nếu $$P(X_{n+1} = j|X_n = i)=P(X_{1} = j|X_0 = i).$$
What is Poisson process? (see chapter 3 of (Springer Texts in Statistics) V. G. Kulkarni (auth.)-Introduction to Modeling and Analysis of Stochastic Systems-Springer New York (2011)).
Phân phối Poisson và quá trình ngẫu nhiên Poisson đóng vai trò quan trọng trong việc xây dựng nhiều quá trình ngẫu nhiên liên tục Markov.
Biến ngẫu nhiên phân phối mũ X (exponential random variables) với tham số $\lambda$, kí hiệu là $X\sim Exp(\lambda)$, có hàm mật độ mũ $f(x) = \lambda e^{-\lambda x}, x \ge 0$. Hàm phân bố tích luỹ có thể tính được $F(x) = P(X\leq x) = 1 - e^{-\lambda x}, x\geq 0$. Do đó, $P(X>x) = e^{-\lambda x}, x\geq 0$. Kì vọng của biến ngẫu nhiên phân phối mũ là $E(X) = \frac{1}{\lambda}$, với phương sai tương ứng là $Var(X) =\frac{1}{\lambda^2}$.
Ví dụ 1. Giả sử một cái máy được sử dụng ở thời điểm $t = 0$. Tuổi thọ của cái máy có thể xem là một biến ngẫu nhiên phân phối mũ, với tham số $\lambda = 0,1/h$. Tính tuổi thọ trung bình của cái máy và độ phương sai tương ứng.
Dùng công thức tính kì vọng và phương sai của một biến ngẫu nhiên phân phối mũ, ta dễ dàng tính được tuổi thọ trung bình của cái máy là 10 giờ, với phương sai tương ứng là 100 giờ (độ lệch chuẩn (sai số so với giá trị kì vọng) là 10 giờ).
Tính xác suất của việc cái máy hoạt động tốt trong 24 giờ. Ta tính $$P(X>24) = e^{-(0,1)24} = 0,0907.$$ Vậy xác suất để máy hoạt động tốt trong 24 giờ là $9\%$.
Giả sử máy hoạt động tốt trong 24 giờ đầu. Tính xác suất để máy hoạt động tốt trong 24 giờ tiếp theo. Ta tính $$P(X>48|X>24) = \frac{P(X>48;X>24)}{P(X>24)}= \frac{P(X>48)}{P(X>24)}= 0.0907.$$
Xác suất để máy hoạt động tốt trong 48 tiếng giống như xác suất để máy hoạt động tốt trong 24 tiếng. Như vậy, nếu trong vòng 24 tiếng đầu, máy không bị hư thì nó sẽ hoạt động như máy mới trong vòng 24 tiếng tiếp theo.
Tính chất trên của biến ngẫu nhiên phân phối mũ được gọi tính chất "quên quá khứ", và đây là một tính chất quan trọng dùng trong các ứng dụng. Ta có định nghĩa tổng quát sau: một biến ngẫu nhiên Xcó tính chất quên quá khứ (memoryless property) nếu $$P(X>t +s|X>s) = P(X>t) \Leftrightarrow \frac{P(X>t+s;X>s)}{P(X>s)} = P(X>t) \Leftrightarrow P(X>t +s) = P(X>s)P(X>t), s, t \geq 0.$$
Ví dụ 2. Giả sử thời gian chờ đợi trung bình tại một ngân hàng là 10 phút. Nếu ta giả sử thời gian chờ đợi này là một biến ngẫu nhiên có phân phối mũ. Khi đó, xác suất để một khách hàng chờ đợi hơn 15 phút tại ngân hàng là bao nhiêu? Giả sử một khách hàng đã chờ đợi 10 phút, tính xác suất để người khách đó chờ đợi thêm ít nhất 5 phút nữa?
Giải. Gọi X là biến ngẫu nhiên thời gian chờ đợi tại ngân hàng. Vì $E(X) = 10$ nên X là biến phân phối mũ với tham số $\lambda = 1/10$. Xác suất để một khách hàng chờ hơn 15 phút tại ngân hàng được tính bởi:
$$P(X>15) = e^{-15.10} = 0,22 (22\%).$$
Vì biến ngẫu nhiên phân phối mũ không nhớ quá khứ nên xác suất để một khách hàng đã chờ 10 phút rồi chờ thêm hơn 5 phút nữa cũng giống như xác suất một người khách mới vào chờ hơn 5 phút. Xác suất đó tính bằng $$P(X>5) = e^{-5.10} = 0,604 (60,4\%).$$
Một điều đặc biệt của biến ngẫu nhiên phân phối mũ là nó là biến ngẫu nhiên dương duy nhất có tính chất quên quá khứ (xem chứng minh trang 61 của Financial Modeling With Jump Processes).
Tiếp theo, ta xem xét biến ngẫu nhiên phân phối Erlang, với hàm mật độ $f(x) = \lambda e^{-\lambda x}\frac{(\lambda x)^{k-1}}{(k-1)!}, x\geq 0;$ hàm phân bố tích luỹ $F(x) = 1 - \sum_{r = 0}^{k - 1} e^{-\lambda x}\frac{(\lambda x)^r}{r!}, x\geq 0.$ Kì vọng của biến ngẫu nhiên là $E(X) =\frac{k}{\lambda}$ với phương sai $Var(X) = \frac{k}{\lambda^2}.$
Định lý sau đây cho thấy mối quan hệ giữa biến ngẫu nhiên phân phối mũ và phân phối Erlang (Gamma). Giả sử $\{X_i, i = 1, 2, ..., n\}$ là các biến độc lập và có cùng phân phối mũ, tham số $\lambda$. Khi đó biến ngẫu nhiên $Z_1$ với $Z_1 = X_1+X_2+...+X_n$ có phân phối Erlang, với tham số $\lambda$.
Giả sử $\{X_i, i = 1, 2, ..., n\}$ là các biến độc lập và có phân phối mũ, với các tham số $\lambda_1, \lambda_2, ...., \lambda_n$ tương ứng. Khi đó biến ngẫu nhiên $Z_2 = \min\{X_1, X_2, ..., X_n\}$ có phân phối mũ với $\lambda = \sum_{i = 1}^n \lambda_i$.
Giả sử $X_1, X_2$ là 2 biến ngẫu nhiên phân phối mũ với các tham số $\lambda_1, \lambda_2$. Khi đó, $$P(X_1 < X_2) = \frac{\lambda_1}{\lambda_1+\lambda_2}.$$
Ví dụ. Một phòng sinh hiện đang có 7 người đang chờ sinh. Ba người được dự đoán là sinh con trai và bốn người được dự đoán là sinh con gái. Bác sĩ hộ sinh cho hay người sinh con trai thông thường trải qua 6 giờ trong bệnh viện, và người sinh con gái trải qua 5 giờ trong bệnh viện. Giả sử rằng thời gian chờ sinh của mỗi người là độc lập với nhau, và đều là biến ngẫu nhiên phân phối mũ. Tính xác suất để đứa trẻ sinh ra đầu tiên là bé trai và được sinh trong giờ tiếp theo.
Giải. Gọi $X_i, i = 1, 2, ..., 7$ là thời gian sinh của các bà mẹ từ thứ nhất đến thứ 7. Không mất tính tổng quát, ta giả sử bà mẹ thứ nhất đến thứ ba sinh con trai, còn lại là sinh con gái. Với giả sử trên, $X_i, 1\leq i\leq 7$ là các biến ngẫu nhiên độc lập, có phân phối mũ, với các tham số tương ứng là $\lambda_1 = \lambda_2 = \lambda_3 = 1/6$, $\lambda_4 = \lambda_5 = \lambda_6=\lambda_7 = 1/5$.
Gọi B là thời gian bé trai đầu tiên được sinh ra và G là thời gian bé gái đầu tiên được sinh ra. Khi đó, B và G là các biến ngẫu nhiên độc lập, được xác định bởi: $B = \min\{X_1, X_2,X_3\}\sim Exp(3/5)$ và $G = \min\{X_4, X_5, X_6, X_7\}\sim Exp(4/5)$.
Xác suất để bé đầu tiên sinh ra là bé trai được tính bởi
$$P(B<G) = \frac{3/6}{3/6+4/5} = \frac{5}{13}.$$
Hơn nữa, thời gian để bé đầu tiên ra đời là biến ngẫu nhiên $\min{B,G}\sim Exp(3/6+4/5) = Exp(1,3).$ Do đó, xác suất để bé đầu tiên sinh ra trong giờ tiếp theo là
$$P(\min{B,G}) \leq 1 = 1 - e^{-1,3} = 0,7275.$$
Vì thời gian sinh ra bé đầu tiên độc lập với giới tính của bé đầu tiên sinh ra nên xác suất cần tính là
$\frac{5}{13}.0,7275=0,2798$.
* Phân phối nhị thức
Giả sử ta tiến hành $n$ phép thử, phép thử thành công với xác suất $p$ và thất bại với xác suất $1-p$. Gọi $X$ là số phép thử thành công trong $n$ phép thử. Khi đó, $X$ là biến ngẫu nhiên phân phối nhị thức, với hàm mật độ $$p_k = P(X = k) = C_n^k p^k(1-p)^{n - k}, 0\leq k \leq n.$$ Khi $n$ lớn, việc tính toán $p_k$ trở nên khó khăn vì $C_n^k$ rất lớn mà $p^k(1-p)^{n - k}$ lại nhỏ. Để đơn giản, ta xét trường hợp $n \rightarrow \infty$ và $p \rightarrow 0$ sao cho tích $np = \lambda$ là một hằng số. Khi đó, $p_k = e^{-\lambda}\frac{\lambda^k}{k!}, k = 0, 1, 2, ...$. Phân phối nhị thức trở thành phân phối Poisson, với tham số $\lambda$. Kì vọng và phương sai của phân phối Poisson đều là $\lambda$.
Ví dụ 1. Đếm số tại nạn tại một điểm giao thông nguy hiểm. Giả sử chỉ có nhiều nhất một tai nạn xảy ra trong một phút (không có hai hay nhiều tai nạn xảy ra cùng một lúc). Ta chia một ngày thành 1440 khoảng thời gian giữa các phút. Gọi $E_k$ là biến cố có tai nạn xảy ra ở phút thứ $k$. Giả sử $E_k$ là các biến cố độc lập và $P(E_k) = 0, 001$. Tính xác suất để có đúng $k$ tai nạn xảy ra trong một ngày.
Giải. Ở đây $n= 1440, p = 0, 001$. Gọi X là số tai nạn trong một ngày. Ta xấp xỉ biến cố $X$ như là biến ngẫu nhiên phân phối Poisson với tham số $\lambda = np = 1,44$. Khi đó, xác suất để có đúng $k$ tai nạn trong một ngày là $P(X = k) =e^{-\lambda}\frac{\lambda^k}{k!}$.
Ví dụ 2. Giả sử tại mỗi thời điểm, chỉ có nhiều nhất một khách hàng đến một cơ sở dịch vụ, và số khách hàng đến cơ sở đó trong một giờ là một biến ngẫu nhiên phân phối Poisson với tham số $8$. Tính xác suất có ít nhất 3 khách hàng đến cơ sở dịch vụ trong một giờ.
Giải. Gọi $X$ là số khách hàng đến cơ sở trong một giờ. Khi đó, $X$ là biến ngẫu nhiên phân phối Poisson với tham số $8$. Do đó, $$P(X\geq 3) = 1 - P(X=0) - P(X = 1) - P(X= 2) = 1-e^{-8}(1+8+64/2) = 0,9862 (98,62\%).$$
Trong thực tế, ta hay gặp một hệ thống mà trạng thái của nó sẽ thay đổi mạnh khi có sự tác động của các yếu tố ngoại cảnh. Ví dụ như một vùng địa lý sẽ thay đổi mạnh khi có động đất, trật tự giao thông của thành phố sẽ bị phá vỡ khi có tai nạn giao thông, sự thịnh vượng của một công ty bảo hiểm sẽ bị tác động khi phải chi trả nhiều khoản bảo hiểm, tin xấu sẽ làm thị trường chứng khoán thụt giảm mạnh.... Việc theo dõi khi nào các yếu tố ngoại cảnh xảy ra là một nhu cầu tất yếu để bảo vệ hệ thống. Tuy nhiên, các yếu tố ngoại cảnh này xảy ra một cách ngẫu nhiên, rất khó dự đoán. Ta có thể phần nào dự đoán về các yếu tố ngoại cảnh nếu ta giả sử rằng việc các yếu tố ngoại cảnh xảy ra là một biến ngẫu nhiên có phân phối mũ. Việc đếm số lượng các yếu tố ngoại cảnh xảy ra trong một khoảng thời gian dẫn đến việc nghiên cứu quá trình ngẫu nhiên đếm Poisson.
Giả sử ta quan tâm đến việc đếm số lần xảy ra trong một khoảng thời gian $t$ (chia ra làm nhiều khoảng thời gian nhỏ) của một yếu tố ngoại cảnh nhất định. Ta gọi $S_n$ là thời gian yếu tố ngoại cảnh xảy ra lần thứ $n$. Giả sử $S_0 = 0$ và gọi $T_n = S_n - S_{n-1}, n \geq 1$. Khi đó, $T_n$ là khoảng thời gian chờ đợi yếu tố ngoại cảnh xảy ra từ lần thứ $n-1$ đến lần thứ $n$. Gọi $N(t) =\max \{n \geq 0: S_n \leq t\}, t\geq 0$ là số lần yếu tố ngoại cảnh xảy ra cho đến trước và tại thời điểm $t$. Khi đó, quá trình ngẫu nhiên đếm $\{N(t),t\geq 0\}$ được gọi là quá trình Poisson với tỉ lệ $\lambda$ nếu $\{T_n\sim Exp(\lambda), n\geq 1\}$. Tại mỗi thời điểm $t$, $N(t)$ là biến ngẫu nhiên phân phối Poisson với tham số $\lambda t$, tức là $$P(N(t) = k)=e^{-\lambda t}\frac{(\lambda t)^k}{k!}, k \geq 0.$$ Do đó $E(N(t) = \lambda t, Var(N(t)) = \lambda t.$ Vì thế, số trung bình số lần yếu tố ngoại cảnh xảy ra là tỉ lệ tuyến tính với thời gian, với tỉ lệ $\lambda$. Quá trình ngẫu nhiên Poisson cũng có tính Markov, tức là tính quên quá khứ (memoryless property) (xem chứng minh ở trang 72 của (Springer Texts in Statistics) V. G. Kulkarni (auth.)-Introduction to Modeling and Analysis of Stochastic Systems-Springer New York (2011). Số lần yếu tố xảy ra ở các khoảng thời gian tách rời là độc lập với nhau và $N(t+s) - N(s) \sim P(\lambda t)$ (phân phối Poisson với tham số $\lambda$). Do đó, $$P(N(t+s) = k|N(s) = j) = e^{-\lambda t} \frac{(\lambda t)^{k - j}}{(k - j)!}, 0 \leq j \leq k.$$
Quá trình ngẫu nhiên Poisson có các bước nhảy độc lập (independent increments) vì số lần yếu tố ngoại cảnh xảy ra trong các khoảng thời gian là độc lập với nhau. Chẳng hạn, số lần yếu tố ngoại cảnh xảy ra trước thời điểm $t = 10$ độc lập với số lần yếu tố ngoại cảnh xảy ra trong khoảng thời gian từ $t = 10$ đến $ t= 15$.
Quá trình ngẫu nhiên Poisson có các bước nhảy ổn định vì phân phối xác suất của số lần yếu tố ngoại cảnh xảy chỉ phụ thuộc vào độ dài của khoảng thời gian. Hay nói cách khác, số lần yếu tố ngoại cảnh xảy ra trong khoảng thời gian $(s, s+t)$ có cùng phân phối xác suất với mọi giá trị của $s$. Như vậy, vai trò của các khoảng thời gian là như nhau, không có sự phân biệt nào, chẳng hạn như giờ cao điểm, giờ vắng ...
Ví dụ. Gọi $N(t)$ là số ca sinh trong một bệnh viên trong khoảng thời gian (0, t]. Giả sử $\{N(t), t\geq 0\}$ là một quá trình ngẫu nhiên Poisson với tỉ lệ 10 ca/ngày.
a. Tính kì vọng và phương sai của số ca sinh trong ca trực 8 tiếng.
Giải. Dùng ngày làm đơn vị thời gian, ta cần tính kì vọng và phương sai của biến ngẫu nhiên N(1/3), có phân phối Poisson tỉ lệ 10/3, tức $N(1/3)\sim P(10/3)$. Do đó, $E(N(1/3)) = 10/3, Var(N(1/3)) = 10/3.$
b. Tính xác suất để không có ca sinh nào trong khoảng thời gian từ 12am đến 1pm.
Giải. Số ca sinh trong khoảng thời gian từ 12am đến 1pm là biến ngẫu nhiên phân phối Poisson $N(1/24) \sim P(10/24)$. Do đó, xác suất cần tính là $P(N(1/24) = 0) = e^{-10/24}= 0.6592 (65.92\%).$
c. Tính xác suất để có 3 ca sinh từ 8 am đến 12 am và 4 ca sinh từ 12 am đến 5 pm.
Giải. Ta lấy 8 am làm mốc thời gian $t = 0$. Khi đó, xác suất cần tính là
\begin{eqnarray*}
&&P(N(4/24) - N(0) = 3; N(8/24)-N(4/24) = 4) = P(N(4/24) - N(0) = 3) P(N(8/24)-N(4/24) = 4) \\
&& = P(N(4/24) = 3) P(N(4/24) = 4) = e^{-10/6}\frac{(10/6)^3}{3!}e^{-10/6}\frac{(10/6)^4}{4!} = 0.0088
\end{eqnarray*}
Đối với quá trình ngẫu nhiên Poisson, ta giả định tại mỗi thời điểm chỉ có nhiều nhất một sự kiện được quan tâm xảy ra. Tuy nhiên, trong thực tế, tại một thời điểm, nhiều sự kiện có thể xảy ra cùng một lúc. Để mô phỏng điều này, ta dùng quá trình ngẫu nhiên Poisson kép. Chẳng hạn, tại mỗi thời điểm, khách hàng đến một nhà hàng theo từng nhóm. Quá trình ngẫu nhiên Poisson không thể mô tả chính xác quá trình này.
Định nghĩa của quá trình ngẫu nhiên Poisson kép. Gọi $\{N(t), t\geq0\}$ là quá trình ngẫu nhiên Poisson với tham số $\lambda$. Gọi $\{C_n, n\geq 1\}$ là dãy các biến ngẫu nhiên độc lập có cùng phân phối, với kì vọng là $\tau$ và moment bậc 2 là $s^2$. Giả sử rằng $\{C_n, n\geq 1\}$ độc lập (không có liên quan) với $\{N(t), t\geq0\}$. Gọi $C(t) = \sum_{n = 1}^{N(t)} C_n, t \geq 0$. Quá trình ngẫu nhiên $\{C(t), t\geq 0\}$ được gọi là quá trình ngẫu nhiên Poisson kép. Kì vọng và phương sai tương ứng là $E(C(t)) = \tau \lambda t$ và $Var(C(t)) = s^2\lambda t.$
Ví dụ Quá trình khách vào một nhà hàng. Giả sử rằng khách hàng đến một nhà hàng theo từng nhóm với số lượng khác nhau. Số lượng người trong từng nhóm được giả định là các biến ngẫu nhiên, độc lập có cùng phân phối nhị thức với tham số $n = 10$ và $p = 0.4$. Khi đó, trung bình mỗi nhóm khách hàng có $\tau = np = 4$ với phương sai tương ứng là $np(1-p) = 2,4$, moment bậc hai là $s^2 = 2.4+4.4 = 18,4$. Các nhóm khách hàng đến nhà hàng tuân theo quá trình ngẫu nhiên Poisson, với tham số $\lambda = 10/hour$ (mỗi tiếng có khoảng 10 nhóm khách hàng). Gọi $C(t)$ là số lượng khách hàng đến nhà hàng đến thời điểm $t$, giả sử $C(0) = 0.$ Khi đó, $\{C(t), t\geq 0\}$ là một quá trình Poisson kép vì $C(t) =\sum_{n = 1}^{N(t)} C_n, t \geq 0$, với $N(t)$ là số nhóm khách đến nhà hàng đến thời điểm $t$, $C_n$ là số lượng người trong từng nhóm.
Kì vọng của $C(t)$ là $4.10t= 40t$, với phương sai là $18,4.10t = 184t$. Vì thế, trong khoảng thời gian từ 7p.m đến 10 p.m (t = 3) thì có trung bình 120 khách hàng với độ lệch chuẩn là $\sqrt{552} = 23.5$ khách hàng.
A good site about stochastic modeling course llink
Không có nhận xét nào:
Đăng nhận xét