OpenVZ Forum: Devel » [PATCH v7 00/10] Request for Inclusion: per-cgroup tcp memory pressure

Home » Mailing lists » Devel » [PATCH v7 00/10] Request for Inclusion: per-cgroup tcp memory pressure

Show: Today's Messages :: Show Polls :: Message Navigator
E-mail to friend

[PATCH v7 02/10] foundations of per-cgroup memory pressure controlling. [message #44308 is a reply to message #44306]

Tue, 29 November 2011 23:56

Glauber Costa
Messages: 916
Registered: October 2011

Senior Member

This patch replaces all uses of struct sock fields' memory_pressure,
memory_allocated, sockets_allocated, and sysctl_mem to acessor
macros. Those macros can either receive a socket argument, or a mem_cgroup
argument, depending on the context they live in.

Since we're only doing a macro wrapping here, no performance impact at all is
expected in the case where we don't have cgroups disabled.

Signed-off-by: Glauber Costa <glommer@parallels.com>
CC: David S. Miller <davem@davemloft.net>
CC: Hiroyouki Kamezawa <kamezawa.hiroyu@jp.fujitsu.com>
CC: Eric W. Biederman <ebiederm@xmission.com>
CC: Eric Dumazet <eric.dumazet@gmail.com>
---
include/net/sock.h | 96 ++++++++++++++++++++++++++++++++++++++++++++++++-
include/net/tcp.h | 3 +-
net/core/sock.c | 62 +++++++++++++++++++-------------
net/ipv4/proc.c | 7 ++--
net/ipv4/tcp_input.c | 12 +++---
net/ipv4/tcp_ipv4.c | 4 +-
net/ipv4/tcp_output.c | 2 +-
net/ipv4/tcp_timer.c | 2 +-
net/ipv6/tcp_ipv6.c | 2 +-
9 files changed, 149 insertions(+), 41 deletions(-)

diff --git a/include/net/sock.h b/include/net/sock.h
index abb6e0f..a71447b 100644
--- a/include/net/sock.h
+++ b/include/net/sock.h
@@ -53,6 +53,7 @@
#include <linux/security.h>
#include <linux/slab.h>
#include <linux/uaccess.h>
+#include <linux/memcontrol.h>

#include <linux/filter.h>
#include <linux/rculist_nulls.h>
@@ -863,6 +864,99 @@ static inline void sk_refcnt_debug_release(const struct sock *sk)
#define sk_refcnt_debug_release(sk) do { } while (0)
#endif /* SOCK_REFCNT_DEBUG */

+static inline bool sk_has_memory_pressure(const struct sock *sk)
+{
+ return sk->sk_prot->memory_pressure != NULL;
+}
+
+static inline bool sk_under_memory_pressure(const struct sock *sk)
+{
+ if (!sk->sk_prot->memory_pressure)
+ return false;
+ return !!*sk->sk_prot->memory_pressure;
+}
+
+static inline void sk_leave_memory_pressure(struct sock *sk)
+{
+ int *memory_pressure = sk->sk_prot->memory_pressure;
+
+ if (memory_pressure && *memory_pressure)
+ *memory_pressure = 0;
+}
+
+static inline void sk_enter_memory_pressure(struct sock *sk)
+{
+ if (sk->sk_prot->enter_memory_pressure)
+ sk->sk_prot->enter_memory_pressure(sk);
+}
+
+static inline long sk_prot_mem_limits(const struct sock *sk, int index)
+{
+ long *prot = sk->sk_prot->sysctl_mem;
+ return prot[index];
+}
+
+static inline long
+sk_memory_allocated(const struct sock *sk)
+{
+ struct proto *prot = sk->sk_prot;
+ return atomic_long_read(prot->memory_allocated);
+}
+
+static inline long
+sk_memory_allocated_add(struct sock *sk, int amt)
+{
+ struct proto *prot = sk->sk_prot;
+ return atomic_long_add_return(amt, prot->memory_allocated);
+}
+
+static inline void
+sk_memory_allocated_sub(struct sock *sk, int amt)
+{
+ struct proto *prot = sk->sk_prot;
+ atomic_long_sub(amt, prot->memory_allocated);
+}
+
+static inline void sk_sockets_allocated_dec(struct sock *sk)
+{
+ struct proto *prot = sk->sk_prot;
+ percpu_counter_dec(prot->sockets_allocated);
+}
+
+static inline void sk_sockets_allocated_inc(struct sock *sk)
+{
+ struct proto *prot = sk->sk_prot;
+ percpu_counter_inc(prot->sockets_allocated);
+}
+
+static inline int
+sk_sockets_allocated_read_positive(struct sock *sk)
+{
+ struct proto *prot = sk->sk_prot;
+
+ return percpu_counter_sum_positive(prot->sockets_allocated);
+}
+
+static inline int
+memcg_sockets_allocated_sum_positive(struct proto *prot, struct mem_cgroup *memcg)
+{
+ return percpu_counter_sum_positive(prot->sockets_allocated);
+}
+
+static inline long
+memcg_memory_allocated(struct proto *prot, struct mem_cgroup *memcg)
+{
+ return atomic_long_read(prot->memory_allocated);
+}
+
+static inline bool
+memcg_memory_pressure(struct proto *prot, struct mem_cgroup *memcg)
+{
+ if (!prot->memory_pressure)
+ return false;
+ return !!prot->memory_pressure;
+}
+

#ifdef CONFIG_PROC_FS
/* Called with local bh disabled */
@@ -1670,7 +1764,7 @@ static inline struct page *sk_stream_alloc_page(struct sock *sk)

page = alloc_pages(sk->sk_allocation, 0);
if (!page) {
- sk->sk_prot->enter_memory_pressure(sk);
+ sk_enter_memory_pressure(sk);
sk_stream_moderate_sndbuf(sk);
}
return page;
diff --git a/include/net/tcp.h b/include/net/tcp.h
index bb18c4d..f080e0b 100644
--- a/include/net/tcp.h
+++ b/include/net/tcp.h
@@ -44,6 +44,7 @@
#include <net/dst.h>

#include <linux/seq_file.h>
+#include <linux/memcontrol.h>

extern struct inet_hashinfo tcp_hashinfo;

@@ -285,7 +286,7 @@ static inline bool tcp_too_many_orphans(struct sock *sk, int shift)
}

if (sk->sk_wmem_queued > SOCK_MIN_SNDBUF &&
- atomic_long_read(&tcp_memory_allocated) > sysctl_tcp_mem[2])
+ sk_memory_allocated(sk) > sk_prot_mem_limits(sk, 2))
return true;
return false;
}
diff --git a/net/core/sock.c b/net/core/sock.c
index 4ed7b1d..44213ab 100644
--- a/net/core/sock.c
+++ b/net/core/sock.c
@@ -1288,7 +1288,7 @@ struct sock *sk_clone(const struct sock *sk, const gfp_t priority)
newsk->sk_wq = NULL;

if (newsk->sk_prot->sockets_allocated)
- percpu_counter_inc(newsk->sk_prot->sockets_allocated);
+ sk_sockets_allocated_inc(newsk);

if (sock_flag(newsk, SOCK_TIMESTAMP) ||
sock_flag(newsk, SOCK_TIMESTAMPING_RX_SOFTWARE))
@@ -1679,28 +1679,26 @@ int __sk_mem_schedule(struct sock *sk, int size, int kind)
long allocated;

sk->sk_forward_alloc += amt * SK_MEM_QUANTUM;
- allocated = atomic_long_add_return(amt, prot->memory_allocated);
+
+ allocated = sk_memory_allocated_add(sk, amt);

/* Under limit. */
- if (allocated <= prot->sysctl_mem[0]) {
- if (prot->memory_pressure && *prot->memory_pressure)
- *prot->memory_pressure = 0;
- return 1;
- }
+ if (allocated <= sk_prot_mem_limits(sk, 0))
+ sk_leave_memory_pressure(sk);

/* Under pressure. */
- if (allocated > prot->sysctl_mem[1])
- if (prot->enter_memory_pressure)
- prot->enter_memory_pressure(sk);
+ if (allocated > sk_prot_mem_limits(sk, 1))
+ sk_enter_memory_pressure(sk);

/* Over hard limit. */
- if (allocated > prot->sysctl_mem[2])
+ if (allocated > sk_prot_mem_limits(sk, 2))
goto suppress_allocation;

/* guarantee minimum buffer size under pressure */
if (kind == SK_MEM_RECV) {
if (atomic_read(&sk->sk_rmem_alloc) < prot->sysctl_rmem[0])
return 1;
+
} else { /* SK_MEM_SEND */
if (sk->sk_type == SOCK_STREAM) {
if (sk->sk_wmem_queued < prot->sysctl_wmem[0])
@@ -1710,13 +1708,13 @@ int __sk_mem_schedule(struct sock *sk, int size, int kind)
return 1;
}

- if (prot->memory_pressure) {
+ if (sk_has_memory_pressure(sk)) {
int alloc;

- if (!*prot->memory_pressure)
+ if (!sk_under_memory_pressure(sk))
return 1;
- alloc = percpu_counter_read_positive(prot->sockets_allocated);
- if (prot->sysctl_mem[2] > alloc *
+ alloc = sk_sockets_allocated_read_positive(sk);
+ if (sk_prot_mem_limits(sk, 2) > alloc *
sk_mem_pages(sk->sk_wmem_queued +
atomic_read(&sk->sk_rmem_alloc) +
sk->sk_forward_alloc))
@@ -1739,7 +1737,9 @@ suppress_allocation:

/* Alas. Undo changes. */
sk->sk_forward_alloc -= amt * SK_MEM_QUANTUM;
- atomic_long_sub(amt, prot->memory_allocated);
+
+ sk_memory_allocated_sub(sk, amt);
+
return 0;
}
EXPORT_SYMBOL(__sk_mem_schedule);
@@ -1750,15 +1750,13 @@ EXPORT_SYMBOL(__sk_mem_schedule);
*/
void __sk_mem_reclaim(struct sock *sk)
{
- struct proto *prot = sk->sk_prot;
-
- atomic_long_sub(sk->sk_forward_alloc >> SK_MEM_QUANTUM_SHIFT,
- prot->memory_allocated);
+ sk_memory_allocated_sub(sk,
+ sk->sk_forward_alloc >> SK_MEM_QUANTUM_SHIFT);
sk->sk_forward_alloc &= SK_MEM_QUANTUM - 1;

- if (prot->memory_pressure && *prot->memory_pressure &&
- (atomic_long_read(prot->memory_allocated) < prot->sysctl_mem[0]))
- *prot->memory_pressure = 0;
+ if (sk_under_memory_pressure(sk) &&
+ (sk_memory_allocated(sk) < sk_prot_mem_limits(sk, 0)))
+ sk_leave_memory_pressure(sk);
}
EXPORT_SYMBOL(__sk_mem_reclaim);

@@ -2474,16 +2472,30 @@ static char proto_method_implemented(const void *method)
{
return method == NULL ? 'n' : 'y';
}
+static long sock_prot_memory_allocated(struct proto *proto,
+ struct mem_cgroup *memcg)
+{
+ return proto->memory_allocated != NULL ? memcg_memory_allocated(proto, memcg): -1L;
+}
+
+static char *sock_prot_memory_pressure(struct proto *proto,
+ struct mem_cgroup *memcg)
+{
+ return proto->memory_pressure != NULL ?
+ memcg_memory_pressure(proto, memcg) ? "yes" : "no" : "NI";
+}

static void proto_seq_printf(struct seq_file *seq, struct proto *proto)
{
+ struct mem_cgroup *memcg = mem_cgroup_from_task(current);
+
seq_printf(seq, "%-9s %4u %6d %6ld %-3s %6u %-3s %-10s "
"%2c %2c %2c %2c %2c %2c %2c %2c %2c %2c %2c %2c %2c %2c %2c %2c %2c %2c %2c\n",
proto->name,
proto->obj_size,
sock_prot_inuse_get(seq_file_net(seq), proto),
- proto->memory_allocated != NULL ? atomic_long_read(proto->memory_allocated) : -1L,
- proto->memory_pressure != NULL ? *proto->memory_pressure ? "yes" : "no" : "NI",
+ sock_prot_memory_allocated(proto, memcg),
+ sock_prot_memory_pressure(proto, memcg),
proto->max_header,
proto->slab == NULL ? "no" : "yes",
module_name(proto->owner),
diff --git a/net/ipv4/proc.c b/net/ipv4/proc.c
index 466ea8b..969172b 100644
--- a/net/ipv4/proc.c
+++ b/net/ipv4/proc.c
@@ -53,20 +53,21 @@ static int sockstat_seq_show(struct seq_file *seq, void *v)
{
struct ...

[ Show the rest of the message ]

Report message to a moderator

[Message index]

		[PATCH v7 00/10] Request for Inclusion: per-cgroup tcp memory pressure By: Glauber Costa on Tue, 29 November 2011 23:56
		[PATCH v7 01/10] Basic kernel memory functionality for the Memory Controller By: Glauber Costa on Tue, 29 November 2011 23:56
		Re: [PATCH v7 01/10] Basic kernel memory functionality for the Memory Controller By: KAMEZAWA Hiroyuki on Wed, 30 November 2011 00:48
		[PATCH v7 02/10] foundations of per-cgroup memory pressure controlling. By: Glauber Costa on Tue, 29 November 2011 23:56
		Re: [PATCH v7 02/10] foundations of per-cgroup memory pressure controlling. By: KAMEZAWA Hiroyuki on Wed, 30 November 2011 00:43
		Re: [PATCH v7 02/10] foundations of per-cgroup memory pressure controlling. By: Glauber Costa on Fri, 02 December 2011 17:46
		Re: [PATCH v7 02/10] foundations of per-cgroup memory pressure controlling. By: KAMEZAWA Hiroyuki on Mon, 05 December 2011 01:59
		Re: [PATCH v7 02/10] foundations of per-cgroup memory pressure controlling. By: Glauber Costa on Mon, 05 December 2011 09:06
		[PATCH v7 05/10] per-netns ipv4 sysctl_tcp_mem By: Glauber Costa on Tue, 29 November 2011 23:56
		[PATCH v7 03/10] socket: initial cgroup code. By: Glauber Costa on Tue, 29 November 2011 23:56
		Re: [PATCH v7 03/10] socket: initial cgroup code. By: KAMEZAWA Hiroyuki on Wed, 30 November 2011 01:07
		[PATCH v7 04/10] tcp memory pressure controls By: Glauber Costa on Tue, 29 November 2011 23:56
		Re: [PATCH v7 04/10] tcp memory pressure controls By: KAMEZAWA Hiroyuki on Wed, 30 November 2011 01:49
		Re: [PATCH v7 04/10] tcp memory pressure controls By: Glauber Costa on Fri, 02 December 2011 17:57
		Re: [PATCH v7 04/10] tcp memory pressure controls By: KAMEZAWA Hiroyuki on Mon, 05 December 2011 02:01
		[PATCH v7 06/10] tcp buffer limitation: per-cgroup limit By: Glauber Costa on Tue, 29 November 2011 23:56
		Re: [PATCH v7 06/10] tcp buffer limitation: per-cgroup limit By: KAMEZAWA Hiroyuki on Wed, 30 November 2011 02:00
		[PATCH v7 07/10] Display current tcp memory allocation in kmem cgroup By: Glauber Costa on Tue, 29 November 2011 23:56
		[PATCH v7 08/10] Display current tcp failcnt in kmem cgroup By: Glauber Costa on Tue, 29 November 2011 23:56
		Re: [PATCH v7 08/10] Display current tcp failcnt in kmem cgroup By: KAMEZAWA Hiroyuki on Wed, 30 November 2011 02:01
		[PATCH v7 09/10] Display maximum tcp memory allocation in kmem cgroup By: Glauber Costa on Tue, 29 November 2011 23:57
		Re: [PATCH v7 09/10] Display maximum tcp memory allocation in kmem cgroup By: KAMEZAWA Hiroyuki on Wed, 30 November 2011 02:02
		[PATCH v7 10/10] Disable task moving when using kernel memory accounting By: Glauber Costa on Tue, 29 November 2011 23:57
		Re: [PATCH v7 10/10] Disable task moving when using kernel memory accounting By: KAMEZAWA Hiroyuki on Wed, 30 November 2011 02:22
		Re: [PATCH v7 10/10] Disable task moving when using kernel memory accounting By: Glauber Costa on Fri, 02 December 2011 18:11
		Re: [PATCH v7 10/10] Disable task moving when using kernel memory accounting By: KAMEZAWA Hiroyuki on Mon, 05 December 2011 02:18
		Re: [PATCH v7 10/10] Disable task moving when using kernel memory accounting By: Glauber Costa on Mon, 05 December 2011 09:18
		Re: [PATCH v7 10/10] Disable task moving when using kernel memory accounting By: KAMEZAWA Hiroyuki on Tue, 06 December 2011 00:07
		Re: [PATCH v7 00/10] Request for Inclusion: per-cgroup tcp memory pressure By: KAMEZAWA Hiroyuki on Wed, 30 November 2011 02:11
		Re: [PATCH v7 00/10] Request for Inclusion: per-cgroup tcp memory pressure By: Glauber Costa on Fri, 02 December 2011 18:04
		Re: [PATCH v7 00/10] Request for Inclusion: per-cgroup tcp memory pressure By: KAMEZAWA Hiroyuki on Mon, 05 December 2011 02:06
		Re: [PATCH v7 00/10] Request for Inclusion: per-cgroup tcp memory pressure By: Glauber Costa on Mon, 05 December 2011 09:09
		Re: [PATCH v7 00/10] Request for Inclusion: per-cgroup tcp memory pressure By: KAMEZAWA Hiroyuki on Mon, 05 December 2011 09:51
		Re: [PATCH v7 00/10] Request for Inclusion: per-cgroup tcp memory pressure By: Glauber Costa on Mon, 05 December 2011 10:28

Previous Topic:	[PATCH v2 0/3] cpuacct cgroup refactoring
Next Topic:	[PATCH 1/7] perf: use event_name() to get an event name

Goto Forum:

-=] Back to Top [=-

[ Syndicate this forum (XML) ] [

] [

]

Current Time: Sun Nov 30 16:39:40 GMT 2025

Total time taken to generate the page: 0.55664 seconds